テクニカルサポート: t.me/hintsage_support

初回起動

初回起動時、ロシア語版と多言語版の両方に無料時間が付くので、すべて試せます。

ロシア語版

音声をリアルタイムで認識しチャットに表示する高速モデル。認識速度は高いが、他言語の用語には向きません。

Multistream

音声をリアルタイムで認識・表示し、他言語に対応する高速モデル。

多言語版

他言語の用語が多い面接・業務向け。ロシア語および英語を含む他言語をサポート。認識テキストはわずかな遅延で表示。

その後、自分に合うバージョンを選び、その1つだけを使えます。

言語モデルの切り替えはオプション(左上の歯車アイコン)にあります。詳細は下の「設定」を参照。

設定と残高

アプリ左上のボタン。ここで残高チャージ、購読、音声認識モデル選択、挙動調整、ホットキー確認ができます。音声が認識されない場合は正しいオーディオデバイスを選択してください。多くの場合そのままで動作します。

残高と購読 — ロシア語版のチャージ、または多言語版の購読。
音声認識言語モデルの選択

ロシア語モデルリアルタイム認識と応答が速いが、英語の用語は認識しない。

Multistream Multistream はロシア語モデルと同様に動作するが、多くの他言語をサポート。

多言語モデル ロシア語と英語(および他言語)を認識。リアルタイムではないため、3つのモードがあります:

1. 期間指定。セッション開始後、アプリは10秒ごとに音声をバッファしチャットで認識。境界で多少の重なりは正常。期間は設定で変更可能:MULTILANG_MODEL_PERIOD_SEC、範囲10〜30秒。

2. 無音時。セッション開始後、アプリは音声をバッファし、無音(ポーズ)のときに認識。ポーズ長は設定で指定可能。

3. 手動開始・停止。録音の開始・終了は自分で決めます。質問の前に開始し質問の後に停止する場合に使用。音声が書き起こされ回答が生成されます。

録音の開始・停止は ALT-E または緑/赤ボタン。連続録音は最大2分。30秒までの区間で認識が最も安定します。

プログラムの一般設定。
  • ホバーで回答を取得カーソルをホバーして回答ボタンをクリックすると、サイレントモードでアプリを使えます。
  • カーソル保護モードオンだとアプリウィンドウ上でカーソルは変わらない。オフだと矢印に変わる。
ここでスクリーンショット(Shot)用のAIモデルを選べます。アルゴリズム・数学タスクには Claude 4 を推奨。複数モニターの場合は Shot に使うモニターも指定可能。
オーディオ設定 — 認識が動かない場合は、ここで正しいスピーカーとマイクを選択してください。
ホットキー — キー組み合わせの確認・変更。カーソル保護とファントムウィンドウモードも参照。
  • カーソル保護モード。このモードではウィンドウ上でカーソルは変わらず、背後の要素を追います。メインウィンドウの要素は引き続きクリック可能。オプションを開くかテンプレートを選ぶと、カーソルは矢印に切り替わります。
  • ファントムウィンドウモード。ウィンドウはマウス移動とクリックに対して完全に透過。画面上にありますがマウス操作はすべて透過します。操作はホットキーのみ。
  • 仮想カーソル。有効にすると2つ目の黄色いカーソルが表示されます。このカーソルとメインウィンドウは不可視。モードをオフにするまで仮想カーソルを操作。実際のカーソルはそのまま。カーソル保護モードがオンのときのみ動作。
Telegram — 回答を受け取る Telegram アカウントを設定できます。
ブラウザでセッション履歴を表示

アシスタントモード

このモードではAIが選択したオーディオソースから音声を認識します。質問が自動検出されたとき、または「回答を取得」を押したとき(その場合は直近の質問に回答)に回答を得られます。

インターフェース概要

すべてのボタンは現在の状態を表示します。

開始ボタン。押すとセッション開始と音声認識が始まります。

開始前にテンプレートを選ぶか作成:面接のトピックやその他有用な情報を記載。外国語面接用のオプション(主言語、翻訳するか・どの言語へ)も設定可能。テンプレートはAIが回答生成時に使用し、形式は自由。回答は英語で、などの指示も追加可能。簡潔か詳細かを選べます。
例:ジュニアアナリスト面接、または外資系のプロジェクトマネージャー面接。回答は英語で。

:

アプリを起動し、面接トピックのテンプレートを作成、オーディオソースをマイクに設定、緑ボタンを押して質問してください。ロシア語版では画面上に認識テキストが出たら「回答を取得」で返答を確認。多言語版では質問を話してから「今認識して回答を取得」を押します。YouTubeで面接動画を探し、質問のところでアプリを起動、ソースをスピーカーに、緑を押して再生 — 同じ流れです。実際のオンライン面接でも同じように動作します。

回答リクエストモード

手動モード。音声は自動認識されチャットに表示されますが、回答は下の「回答を取得」を押したときだけリクエストされます。いつ回答を得るかは完全に自分で制御。

自動+手動(ハンズフリー)。アプリが質問を検出して回答。ロシア語版:発話終了のポーズを待つため遅れが出ることがある。既に認識されたテキストから即答したい場合は「回答を取得」を使用。多言語版:質問検出と回答は認識期間の終わり、または「認識」を押した場合は即座に実行。

オーディオソース

音声は複数のソースから取得できます。スピーカー — スピーカーに再生される音声を認識(マイクではない)。マイク — マイクに入る音声を認識(スピーカーではない)。テスト時はマイク、実際の面接ではスピーカー(面接官の声はスピーカーから出るため)を使用。

スピーカー。面接のメインモード:スピーカーに送られる音声から認識。

マイク。面接官役で自分が質問するテスト時に使用。

画面上タスク(live coding)

1つ目のボタン(カメラアイコン):スクリーンショットを撮りタスクテキストを抽出。これが Shot。デフォルトでは画面全体をキャプチャ。

2つ目のボタン(虫眼鏡):コードレビュー — 問題と提案を表示。

タスクをクリップボードにコピーし(画面に収まらない場合など)、3つ目のボタン(メモ帳)を押すとスクリーンショットの代わりにクリップボードの内容を使用できます。

ホットキーは設定で有効にできます。

スローとファストモード
デフォルトではスクリーンショットは会話と同じモデルを使用。難しいタスクでは思考モデル(遅い、30秒以上かかる場合あり)に切り替え可能。Shot ヘッダーをクリックで「思考Shot」に切り替え、もう一度で元に戻ります。
Shot用AIモデル
設定(上)で Shot 用のAIモデルを選べます。タスクによっては特定のモデルが向いています。

ホットキー:

  • Alt + S — 全画面Shot
  • Ctrl + S — Shot用領域選択
  • Alt + C — クリップボードからタスクを取得
  • Ctrl + Alt + P — Shotモデル切り替え

画面に収まらないタスク

組み込みの簡単な方法はありません。代替として、ページのテキストをオンデマンドでアプリに送る Chrome プラグインがあります。

インストーラーに chrome_plugin フォルダ(プラグインとセットアップ手順)が含まれています。インストール後、アプリを起動し、タスクやオンラインエディタのコードがあるサイトを開いてください。Shift(オンラインエディタ内のテキストの場合は Ctrl)を押すと、Shotパネル周りに枠が表示されます。緑はプラグイン接続済み、黄は未接続(数秒待ってください)。カメラアイコンは T に、虫眼鏡は反転してモードが分かります。枠が緑のとき、画面上タスクには T アイコン、コードレビューには虫眼鏡を使用。

Note: 注意:一部のサイトでは動作しない場合があります。セッション後はプラグインを無効にすることを推奨。10秒ごとにアプリにポーリングします。

外国語での面接

テンプレート作成・編集フォームで「外国語での面接」セクションを展開し、言語とオプションを設定します。

「オーディオの言語」に話す言語をそれぞれ追加し、特定の言語で回答が必要なら「回答言語」を設定。回答内での質問の翻訳、認識テキストのオプションのライブ翻訳(自動、ボタン押下、または両方)も要求できます。

簡単な例:ドイツ語の面接。オーディオの言語にドイツ語を追加。回答をドイツ語で読み上げたい場合は回答言語をドイツ語に設定し、保存してテスト(例:YouTubeやマイクで)。

音声認識には Multistream モデルから始めてください — 多くの言語をサポートしリアルタイム翻訳が可能です。

お問い合わせ

ユーザーグループ: t.me/hintsage_news

テクニカルサポート: t.me/hintsage_support