技术支持: t.me/hintsage_support
首次运行时可免费试用俄语版和多语版,以便体验全部功能。
快速模型,实时识别并在聊天中显示语音。识别速度快,但不适合外语术语。
快速模型,实时识别并显示语音,支持多语。
适用于外语术语较多的面试与工作。支持俄语及包括英语在内的其他语言。识别文本会有短暂延迟。
之后可选择适合的版本并仅使用该版本。
语言模型切换在选项(左上齿轮图标)中。详见下方「设置」部分。

应用左上角按钮。在此可充值、订阅、选择语音识别模型、调整行为、查看快捷键。若无法识别声音,可在此选择正确的音频设备。通常开箱即用。
余额与订阅——为俄语版充值或购买多语版订阅。
语音识别语言模型选择俄语模型 — 实时识别好、响应快,但不识别英语术语。
Multistream Multistream 与俄语模型类似但支持多种外语。
多语模型 识别俄语和英语(及其他)。非实时,因此有三种模式:
1. 按周期。会话开始后应用每 10 秒缓冲音频并识别到聊天。周期边界有重叠属正常。周期长度可在配置中修改:MULTILANG_MODEL_PERIOD_SEC,范围 10–30 秒。
2. 按静音。会话开始后应用缓冲音频,在出现静默(停顿)时识别。停顿长度可在设置中配置。
3. 手动开始/停止。由你决定何时开始和停止录音。适合在问题前开始、问题后停止。音频会被转写并生成答案。
开始/停止录音请使用 ALT-E 或绿/红按钮。单次连续录音最长 2 分钟;识别效果以 30 秒以内片段最佳。
程序通用设置。
在此可选择截图 (Shot) 使用的 AI 模型。算法与数学任务推荐 Claude 4。多显示器时也可设置用于 Shot 的显示器。
音频设置——若识别异常,请在此选择正确的扬声器和麦克风设备。
快捷键——查看与修改组合。另见光标保护与幽灵窗口模式。
Telegram — 可配置 Telegram 账户以在此接收答案。
在浏览器中查看会话历史此模式下 AI 从所选音频源识别语音。当自动检测到问题或你按下「获取答案」时会得到答案(后者会回答最近的问题)。
所有按钮显示当前状态。

开始按钮。按下以开始会话并启动语音识别。

开始前选择或创建模板:描述面试主题及有用信息。也可设置外语面试选项(主语言、是否翻译及目标语言)。模板供 AI 生成答案时使用,格式不限。可添加如「答案须为英语」等说明。选择需要简短还是详细答案。
示例:初级分析师面试或外企项目经理面试。答案用英语。
启动应用,创建带面试主题的模板,将音频源设为麦克风,按绿色按钮后提问。俄语版:看到屏幕上识别出的文字后按「获取答案」查看回复。多语版:说完问题后按「立即识别并获取答案」。也可在 YouTube 找面试视频、跳到某题、启动应用、将源设为扬声器、按绿色并播放——流程相同。应用在真实在线面试中同样工作。

手动模式。语音自动识别并显示在聊天中,但仅在你按下底部「获取答案」时请求答案。你完全控制何时获取答案。

自动 + 手动(免提)。应用检测到提问时自动回答。俄语版:可能在等待停顿以检测说话结束时有延迟;可用「获取答案」从已识别文字立即回复。多语版:问题检测与答案在识别周期结束时发生,或按「识别」时立即发生。
语音可来自不同源。扬声器——识别发送到扬声器的内容(非麦克风)。麦克风——识别对着麦克风说的内容(非扬声器)。测试时用麦克风;真实面试用扬声器,因面试官声音来自扬声器。

扬声器。面试主模式:从发送到扬声器的内容识别语音。

麦克风。当你作为面试官提问时用于测试。

第一个按钮(相机图标):截图并提取任务文字。即 Shot。默认捕获整屏。
第二个按钮(放大镜):代码审查——显示问题与建议。
可将任务复制到剪贴板(如放不下屏幕)并按第三个按钮(记事本)以用剪贴板内容代替截图。
快捷键可在设置中启用。
快捷键:
没有内置的简单方案。变通做法是使用 Chrome 插件按需将页面文字发送到应用。
安装包内含 chrome_plugin 文件夹,含插件与安装说明。安装后运行应用,打开带任务或在线编辑器中代码的页面。按住 Shift(若文字在在线编辑器中则按 Ctrl);Shot 面板周围会出现边框。绿色表示已连接插件,黄色表示尚未(等几秒)。相机图标会变成 T,放大镜会镜像以便区分模式。边框为绿色时,用 T 图标处理屏幕任务或用放大镜做代码审查。
Note: 注意:部分网站可能无效。建议会话结束后禁用插件;它会每 10 秒轮询应用。
在模板创建/编辑表单中展开「外语面试」部分以设置语言与选项。
在「音频中的语言」中添加将使用的每种语言,然后若需要特定语言答案可设置「答案语言」。也可要求在答案中翻译问题,以及可选的已识别文字实时翻译(自动、按按钮或两者)。
简单情况:德语面试。在音频语言中添加德语。若希望答案为德语以便朗读,将答案语言设为德语,保存并测试(如通过 YouTube 或麦克风)。
语音识别建议先用 Multistream 模型——支持多语并支持实时翻译。
用户群: t.me/hintsage_news
技术支持: t.me/hintsage_support