Gemini CLI
| 開発者(チーム) | Gemini CLI Team |
|---|---|
| 初期リリース日 | 2024年 |
| OS | Windows, macOS, Linux |
| 種類 | AIエージェント、CLIツール |
| ライセンス | MIT |
| ホームページ | https://geminicli.com/ |
Gemini CLIは、GoogleのGeminiモデルをベースとした対話型のコマンドラインインターフェース(CLI)エージェントである。ユーザーのローカル環境で直接動作し、ファイルシステムの操作、シェルコマンドの実行、ウェブ検索などのツールを駆使して、複雑なソフトウェアエンジニアリングタスクを実行できる。
主な機能
- ファイルシステムの操作: ファイルの読み書きや修正、ディレクトリ構造の探索。
- シェルコマンドの実行: ターミナルコマンドを直接実行し、ビルド、テスト、デプロイなどの作業を行う。
- コードベースの分析: プロジェクト全体の構造を把握し、コード間の依存関係を分析する専用エージェント(`codebase_investigator`)を搭載。
- ウェブ検索とデータ抽出: リアルタイムのGoogle検索とウェブページの内容抽出により、最新情報を活用。
- マルチメディア処理: テキストだけでなく、画像、音声、PDFファイルなどの読み取りと分析。
設置と実行
Gemini CLIはNode.js環境で動作し、npmを通じてグローバルにインストールして使用できる。
インストール
npm install -g @google/gemini-cli
実行
インストール完了後、ターミナルで以下のコマンドを入力して実行する。
gemini
実行時にはGoogle AI Studioで発行されたAPIキーの設定が必要になる場合がある。
使い方とヒント
対話モード
起動後、ターミナルに自然言語で直接命令を入力する。エージェントは状況に応じて適切なツールを自動的に呼び出す。
コードの修正とリファクタリング
特定の機能の実装やバグ修正を依頼すると、エージェントが関連ファイルを探して分析し、`replace`ツールなどを使用してコードを安全に修正する。修正の前後にテストを実行するよう指示することで、より安全な作業が可能。
コードベースの調査
プロジェクトに新しく参加した場合や、大規模なリファクタリングが必要な場合に以下のように依頼できる。
- 「このプロジェクトの全体的なアーキテクチャを説明して。」
- 「特定の機能が実装されている場所と関連ロジックを探して。」
効率的な活用のヒント
- 具体的な指示: 「コードを直して」よりも「A関数の入出力タイプをBに変更し、関連するテストコードを更新して」のように具体的に指示することで、より正確な結果が得られる。
- 並列作業: 複数のファイルの読み取りや検索を行う際、エージェントがツールを並列に呼び出すことで時間を短縮する。
- コンテキストの維持: 対話の流れを通じて以前の作業内容を記憶しているため、段階的に複雑な作業を指示できる。