Technischer Support: t.me/hintsage_support

Erste Ausführung

Bei der ersten Ausführung erhalten Sie kostenlose Zeit für die russischsprachige und die mehrsprachige Version, um alle auszuprobieren.

Russischsprachige Version

Schnelles Modell, das Sprache im Chat in Echtzeit erkennt und anzeigt. Gute Erkennungsgeschwindigkeit, aber nicht für Begriffe in anderen Sprachen geeignet.

Multistream

Schnelles Modell, das Sprache in Echtzeit erkennt und anzeigt und andere Sprachen unterstützt.

Mehrsprachige Version

Für Interviews und Jobs mit vielen Begriffen in anderen Sprachen. Unterstützt Russisch und andere Sprachen inkl. Englisch. Zeigt den erkannten Text mit kurzer Verzögerung.

Anschließend können Sie wählen, welche Version zu Ihnen passt, und nur diese nutzen.

Der Sprachmodell-Wechsel befindet sich in den Optionen (Zahnrad-Symbol oben links). Siehe Abschnitt Einstellungen weiter unten.

Einstellungen und Guthaben

Schaltfläche in der oberen linken Ecke der App. Dort können Sie Guthaben aufladen, abonnieren, das Spracherkennungsmodell wählen, das Verhalten anpassen und die Tastenkürzel einsehen. Wenn Ton nicht erkannt wird, können Sie die richtigen Audiogeräte auswählen. Meist funktioniert es ohne Konfiguration.

Guthaben und Abos — russischsprachige Version aufladen oder Abo für die mehrsprachige Version kaufen.
Auswahl des Spracherkennungsmodells

Russisches Modellgute Echtzeit-Erkennung und schnelle Antwort, erkennt aber keine englischen Begriffe.

Multistream Multistream funktioniert wie das russische Modell, unterstützt aber viele Sprachen.

Mehrsprachiges Modell erkennt Russisch und Englisch (und andere). Läuft nicht in Echtzeit, daher gibt es drei Modi:

1. Nach Zeitraum. Nach Sitzungsstart puffert die App alle 10 Sekunden Audio und erkennt es dann im Chat. Etwas Überlappung an den Grenzen ist normal. Die Dauer kann in der Konfiguration geändert werden: MULTILANG_MODEL_PERIOD_SEC, Bereich 10–30 s.

2. Bei Stille. Nach Sitzungsstart puffert die App Audio und erkennt bei Stille (Pause). Die Pausenlänge kann in den Einstellungen festgelegt werden.

3. Manueller Start/Stopp. Sie entscheiden, wann Aufnahme starten und stoppen. Nutzen Sie es, wenn Sie vor der Frage starten und danach stoppen. Audio wird transkribiert und eine Antwort generiert.

Zum Starten/Stoppen der Aufnahme nutzen Sie ALT-E oder die grüne/rote Schaltfläche. Maximale Dauer einer Aufnahme 2 Minuten; Erkennung funktioniert am besten mit Abschnitten bis 30 Sekunden.

Allgemeine Programmeinstellungen.
  • Antwort bei Überfahren erhaltenklicken Sie die Antwort-Schaltfläche durch Überfahren mit dem Cursor, um die App im stillen Modus zu nutzen.
  • Cursor-Schutzmoduswenn aktiv, ändert sich der Cursor nicht über dem App-Fenster; wenn aus, wechselt er zu einem Pfeil.
Hier können Sie das KI-Modell für Screenshots (Shots) wählen. Für Algorithmus- und Matheaufgaben empfehlen wir Claude 4. Sie können auch einstellen, welchen Monitor Sie für Shots nutzen, wenn Sie mehrere haben.
Audioeinstellungen — wenn Erkennung nicht funktioniert, wählen Sie hier die richtigen Lautsprecher- und Mikrofongeräte.
Tastenkürzel — anzeigen und ändern. Siehe auch Cursor-Schutz und Phantom-Fenstermodus.
  • Cursor-Schutzmodus. In diesem Modus ändert sich der Cursor nicht über dem Fenster und folgt den Elementen dahinter. Sie können weiterhin auf Elemente des Hauptfensters klicken. Beim Öffnen von Optionen oder Vorlagenauswahl wechselt der Cursor zu einem Pfeil.
  • Phantom-Fenstermodus. Das Fenster ist für Mausbewegungen und Klicks vollständig transparent. Es bleibt auf dem Bildschirm, aber alle Mausaktionen gehen hindurch. Sie steuern es mit Tastenkürzeln.
  • Virtueller Cursor. Wenn aktiviert, erscheint ein zweiter gelber Cursor. Dieser Cursor und das Hauptfenster sind unsichtbar; Sie steuern den virtuellen Cursor, bis Sie den Modus ausschalten. Der echte Cursor bleibt an Ort und Stelle. Funktioniert nur mit aktiviertem Cursor-Schutzmodus.
Telegram — Sie können Ihr Telegram-Konto einrichten, um Antworten dort zu erhalten.
Sitzungsverlauf im Browser anzeigen

Assistentenmodus

In diesem Modus erkennt die KI die Sprache aus der gewählten Audioquelle. Sie erhalten eine Antwort, wenn automatisch eine Frage erkannt wird oder wenn Sie „Antwort erhalten“ drücken (dann antwortet sie auf die letzte(n) Frage(n)).

Überblick über die Oberfläche

Alle Schaltflächen zeigen ihren aktuellen Zustand.

Start-Schaltfläche. Drücken Sie sie, um eine Sitzung zu beginnen und die Spracherkennung zu starten.

Vor dem Start wählen oder erstellen Sie eine Vorlage: beschreiben Sie das Interviewthema und weitere nützliche Infos. Sie können auch Optionen für Interviews in anderen Sprachen einstellen (Hauptsprache, ob übersetzen und in welche Sprache). Die Vorlage wird von der KI bei der Antwortgenerierung genutzt und kann beliebig formatiert sein. Sie können Anweisungen hinzufügen wie „Antworten müssen auf Englisch sein“. Wählen Sie kurze oder ausführliche Antworten.
Beispiel: Junior-Analysten-Interview oder Projektleiter-Interview in einem ausländischen Unternehmen. Antworten auf Englisch.

Beispiel:

Starten Sie die App, erstellen Sie eine Vorlage mit dem Interviewthema, setzen Sie die Audioquelle auf Mikrofon, drücken Sie die grüne Schaltfläche und stellen Sie eine Frage. Bei der russischsprachigen Version: Wenn Sie den erkannten Text auf dem Bildschirm sehen, drücken Sie „Antwort erhalten“. Bei der mehrsprachigen Version: Sagen Sie die Frage und drücken Sie dann „Jetzt erkennen und Antwort erhalten“. Sie können auch ein Interview-Video auf YouTube finden, zu einer Frage gehen, die App starten, Quelle auf Lautsprecher setzen, Grün drücken und das Video abspielen — gleicher Ablauf. Die App funktioniert genauso bei einem echten Online-Interview.

Antwort-Anforderungsmodus

Manueller Modus. Sprache wird automatisch erkannt und im Chat angezeigt, aber eine Antwort wird nur angefordert, wenn Sie unten „Antwort erhalten“ drücken. Sie kontrollieren vollständig, wann Sie eine Antwort bekommen.

Auto + manuell (Freisprechen). Die App erkennt, wann eine Frage gestellt wird, und antwortet. Russische Version: Es kann eine Verzögerung geben, während auf eine Pause zum Erkennen des Redeendes gewartet wird; nutzen Sie „Antwort erhalten“ für eine sofortige Antwort aus dem bereits erkannten Text. Mehrsprachige Version: Fragenerkennung und Antwort erfolgen am Ende des Erkennungszeitraums oder sofort bei Drücken von „Erkennen“.

Audioquelle

Sprache kann aus verschiedenen Quellen kommen. Lautsprecher — erkennen, was an die Lautsprecher gesendet wird (nicht das Mikrofon). Mikrofon — erkennen, was ins Mikrofon gesprochen wird (nicht von den Lautsprechern). Zum Testen Mikrofon nutzen; bei einem echten Interview Lautsprecher, weil die Stimme des Interviewers aus den Lautsprechern kommt.

Lautsprecher. Hauptmodus für Interviews: Sprache wird aus dem an die Lautsprecher gesendeten erkannt.

Mikrofon. Zum Testen nutzen, wenn Sie als Interviewer die Fragen stellen.

Aufgaben auf dem Bildschirm (Live Coding)

Erste Schaltfläche (Kamera-Symbol): Screenshot machen und Aufgabentext extrahieren. Das ist ein Shot. Standardmäßig wird der gesamte Bildschirm erfasst.

Zweite Schaltfläche (Lupe): Code-Review — zeigt Probleme und Vorschläge.

Sie können die Aufgabe in die Zwischenablage kopieren (z. B. wenn sie nicht auf den Bildschirm passt) und die dritte Schaltfläche (Notizblock) drücken, um Zwischenablage-Inhalt statt eines Screenshots zu nutzen.

Tastenkürzel können in den Einstellungen aktiviert werden.

Langsame und schnelle Modi
Standardmäßig nutzen Screenshots dasselbe Modell wie die Konversation. Für schwierigere Aufgaben können Sie zum Denkmodell wechseln (langsamer, bis 30+ Sekunden). Klicken Sie auf die Überschrift Shot, um zu „Denk-Shot“ zu wechseln; ein weiterer Klick wechselt zurück.
KI-Modell für Shots
In den Einstellungen (oben) können Sie das KI-Modell für Shots wählen. Manche Aufgaben funktionieren besser mit bestimmten Modellen.

Tastenkürzel:

  • Alt + S — Vollbild-Screenshot
  • Ctrl + S — Bereich für Shot auswählen
  • Alt + C — Aufgabe aus Zwischenablage übernehmen
  • Ctrl + Alt + P — Shot-Modell umschalten

Aufgaben, die nicht auf den Bildschirm passen

Es gibt keine eingebaute einfache Lösung. Ein Workaround ist ein Chrome-Plugin, das Seitentext bei Bedarf an die App sendet.

Der Installer enthält einen Ordner chrome_plugin mit dem Plugin und Einrichtungsanleitung. Nach der Installation starten Sie die App, öffnen Sie eine Seite mit einer Aufgabe oder Code in einem Online-Editor. Halten Sie Shift (oder Ctrl, wenn der Text in einem Online-Editor steht); ein Rahmen erscheint um das Shot-Panel. Grün bedeutet mit Plugin verbunden, Gelb noch nicht (einige Sekunden warten). Das Kamera-Symbol wird zu T und die Lupe ist gespiegelt, damit Sie den Modus erkennen. Wenn der Rahmen grün ist, nutzen Sie das T-Symbol für Aufgaben auf dem Bildschirm oder die Lupe für Code-Review.

Note: Hinweis: Kann auf einigen Seiten nicht funktionieren. Wir empfehlen, das Plugin nach der Sitzung zu deaktivieren; es pollt die App alle 10 Sekunden.

Interviews in anderen Sprachen

Im Vorlage Erstellen/Bearbeiten-Formular erweitern Sie den Abschnitt „Interviews in anderen Sprachen“, um Sprachen und Optionen einzustellen.

Unter Sprachen im Audio fügen Sie jede gesprochene Sprache hinzu, dann setzen Sie Antwortsprache, wenn Sie Antworten in einer bestimmten Sprache wollen. Sie können auch Übersetzung der Frage in der Antwort und optionale Live-Übersetzung des erkannten Textes anfordern (automatisch, per Tastendruck oder beides).

Beispiel

Einfacher Fall: Interview auf Deutsch. Fügen Sie Deutsch zu Sprachen im Audio hinzu. Um Antworten auf Deutsch zu erhalten und sie vorlesen zu können, setzen Sie Antwortsprache auf Deutsch, speichern und testen (z. B. über YouTube oder Mikrofon).

Für Spracherkennung beginnen Sie mit dem Modell Multistream — es unterstützt viele Sprachen und liefert Echtzeit-Übersetzung.

Kontakt

Nutzerkreis: t.me/hintsage_news

Technischer Support: t.me/hintsage_support