Site Reliability Engineer (SRE) / Platform Engineer / サイトリライアビリティエンジニア
Location / Employment Type / 勤務地・雇用形態
Full-time position based in Tokyo with flexible working arrangements, including a full flex-time system or discretionary work style.
東京勤務の正社員ポジション。フルフレックスまたは裁量労働制が適用され、柔軟な働き方が可能です。
Company Overview / 企業概要
This opportunity is with a fast-growing global technology company specializing in AI-powered solutions within a highly specialized domain. Since its establishment, the company has expanded internationally and continues to scale its product portfolio, leveraging advanced technologies such as large language models and AI-driven platforms to support enterprise clients.
本ポジションは、高度な専門領域に特化したAIプロダクトを展開するグローバルテクノロジー企業での募集です。設立以降、海外展開を加速させながら事業を拡大し、LLMやAI技術を活用したサービスを通じて企業の課題解決を支援しています。
Role Overview / 業務概要
In this role, you will be responsible for ensuring system reliability and improving developer experience as part of the SRE or Platform Engineering function. The position involves both organization-wide initiatives and close collaboration with specific product teams to enhance system performance, scalability, and operational efficiency.
本ポジションでは、SREまたはPlatform Engineerとして、システムの信頼性向上および開発者体験の改善を担います。組織横断的な取り組みと、特定プロダクトチームとの連携の両面から、パフォーマンスやスケーラビリティ、運用効率の向上に貢献します。
Key Responsibilities / 主な業務内容
Ensure high system reliability by focusing on availability, latency, performance, and scalability, while supporting efficient software development and operations through well-designed infrastructure. Collaborate with security teams to enhance system security and ensure compliance with relevant standards.
可用性・レイテンシー・パフォーマンス・スケーラビリティに注力しながら、安定したサービス提供を実現します。また、効率的な開発・運用を支えるインフラ設計を行い、セキュリティチームと連携してセキュリティ強化や各種コンプライアンス対応を推進します。
Design, build, and maintain automation tools and monitoring systems, including alerting and on-call processes. Reduce manual operations through scripting and automation, identify and resolve performance bottlenecks, and optimize system architecture.
監視・運用の自動化ツールの設計・構築、アラート・オンコール体制の整備を行います。スクリプトや自動化により運用負荷を軽減し、パフォーマンス課題の特定・改善やアーキテクチャ最適化を推進します。
Work closely with product development, AI engineering, and security teams to continuously improve system reliability and scalability across platforms.
プロダクト開発チーム、AI技術チーム、セキュリティチームと連携し、システムの信頼性・拡張性の向上に継続的に取り組みます。
Qualifications / 応募要件
Candidates should have approximately 3+ years of experience in SRE or a related field, along with experience in software development or automation using languages such as Go or Python. Hands-on experience with public cloud platforms (e.g., AWS, GCP, or Azure) and infrastructure as code tools is required, as well as experience managing container orchestration environments.
SREまたは関連領域での実務経験3年以上に加え、GoやPythonなどを用いた開発または自動化の経験が求められます。AWS、GCP、Azureなどのクラウド環境およびIaCツールの利用経験、コンテナオーケストレーションの運用経験が必要です。
Experience in SaaS operations and strong communication skills in Japanese are required, with business-level English considered an advantage.
SaaS運用経験および日本語での業務対応力が必須です。英語でのビジネスコミュニケーション能力があれば尚可です。
Additional experience in areas such as large-scale distributed systems, security, AI/ML infrastructure, or platform engineering is beneficial.
大規模分散システム、セキュリティ、AI/ML基盤、Platform Engineeringなどの経験があれば歓迎されます。
Compensation & Benefits / 給与・福利厚生
Annual salary is competitive and based on experience, with a wide range reflecting seniority. The company offers comprehensive benefits including full social insurance, flexible leave policies, professional development support, and access to advanced AI and development tools.
年収は経験・スキルに応じて決定され、幅広いレンジが設定されています。各種社会保険、柔軟な休暇制度、自己研鑽支援、最新のAIツールや開発環境の提供など、充実した福利厚生が用意されています。