Wsparcie techniczne: t.me/hintsage_support

Pierwsze uruchomienie

Przy pierwszym uruchomieniu masz darmowy czas na wersję rosyjskojęzyczną i wielojęzyczną, żeby je wszystkie wypróbować.

Wersja rosyjskojęzyczna

Szybki model rozpoznający i wyświetlający mowę na czacie w czasie rzeczywistym. Dobra szybkość rozpoznawania, ale nie nadaje się do terminów w innych językach.

Multistream

Szybki model rozpoznający i wyświetlający mowę w czasie rzeczywistym, obsługujący inne języki.

Wersja wielojęzyczna

Do rozmów i zadań z dużą liczbą terminów w innych językach. Obsługuje rosyjski i inne języki, w tym angielski. Pokazuje rozpoznany tekst z krótkim opóźnieniem.

Potem możesz wybrać, która wersja Ci pasuje, i używać tylko jej.

Przełączanie modelu języka jest w opcjach (ikona zębatki w lewym górnym rogu). Zobacz sekcję Ustawienia poniżej.

Ustawienia i saldo

Przycisk w lewym górnym rogu aplikacji. Tam możesz doładować saldo, wykupić subskrypcję, wybrać model rozpoznawania mowy, dostosować zachowanie i zobaczyć skróty. Jeśli dźwięk nie jest rozpoznawany, możesz wybrać właściwe urządzenia audio. Zwykle działa od razu.

Saldo i subskrypcje — doładuj wersję rosyjskojęzyczną lub kup subskrypcję wersji wielojęzycznej.
Wybór modelu rozpoznawania mowy

Model rosyjskojęzycznydobre rozpoznawanie w czasie rzeczywistym i szybka odpowiedź, ale nie rozpoznaje terminów angielskich.

Multistream Multistream działa jak model rosyjski, ale obsługuje wiele języków obcych.

Model wielojęzyczny rozpoznaje rosyjski i angielski (i inne). Nie działa w czasie rzeczywistym, więc są trzy tryby:

1. Po okresie. Po uruchomieniu sesji aplikacja buforuje dźwięk co 10 sekund i rozpoznaje go na czacie. Pewne nakładanie na granicach okresów jest normalne. Długość okresu można zmienić w konfigu: MULTILANG_MODEL_PERIOD_SEC, zakres 10–30 s.

2. Po ciszy. Po uruchomieniu sesji aplikacja buforuje dźwięk i rozpoznaje przy ciszy (pauzie). Długość pauzy można ustawić w ustawieniach.

3. Ręczny start/stop. Ty decydujesz, kiedy rozpocząć i zakończyć nagrywanie. Użyj, gdy zaczynasz przed pytaniem i kończysz po. Dźwięk jest transkrybowany i generowana jest odpowiedź.

Żeby uruchomić/zatrzymać nagrywanie, użyj ALT-E lub zielonego/czerwonego przycisku. Maks. ciągłe nagrywanie to 2 minuty; rozpoznawanie działa najlepiej z fragmentami do 30 sekund.

Ogólne ustawienia programu.
  • Otrzymaj odpowiedź przy najechaniukliknij przycisk odpowiedzi, najechawszy na niego kursorem, żeby używać aplikacji w trybie cichym.
  • Tryb ochrony kursoragdy włączony, kursor nie zmienia się nad oknem aplikacji; gdy wyłączony, zmienia się na strzałkę.
Tu możesz wybrać model AI do zrzutów (shotów). Do zadań algorytmicznych i matematycznych polecamy Claude 4. Możesz też ustawić, którego monitora używać do shotów przy wielu monitorach.
Ustawienia dźwięku — jeśli rozpoznawanie nie działa, wybierz tu właściwe urządzenia głośnika i mikrofonu.
Skróty — przeglądaj i zmieniaj kombinacje. Zobacz też ochronę kursora i tryb okna widma.
  • Tryb ochrony kursora. W tym trybie kursor nie zmienia się nad oknem i podąża za elementami za nim. Nadal możesz klikać elementy głównego okna. Przy otwieraniu opcji lub wyborze szablonu kursor przełączy się na strzałkę.
  • Tryb okna widma. Okno jest w pełni przezroczyste dla ruchów i kliknięć myszy. Zostaje na ekranie, ale wszystkie działania myszy przechodzą przez nie. Sterujesz skrótami.
  • Kursor wirtualny. Po włączeniu pojawia się drugi żółty kursor. Ten kursor i główne okno są niewidoczne; sterujesz kursorem wirtualnym, aż wyłączysz tryb. Prawdziwy kursor zostaje w miejscu. Działa tylko z włączonym trybem ochrony kursora.
Telegram — możesz skonfigurować konto Telegram, żeby otrzymywać tam odpowiedzi.
Zobacz historię sesji w przeglądarce

Tryb asystenta

W tym trybie AI rozpoznaje mowę z wybranego źródła dźwięku. Otrzymujesz odpowiedź albo gdy pytanie jest wykryte automatycznie, albo gdy naciśniesz Otrzymaj odpowiedź (wtedy odpowiada na ostatnie pytanie(a)).

Przegląd interfejsu

Wszystkie przyciski pokazują swój aktualny stan.

Przycisk Start. Naciśnij, żeby rozpocząć sesję i uruchomić rozpoznawanie mowy.

Przed startem wybierz lub utwórz szablon: opisz temat rozmowy i inne przydatne informacje. Możesz też ustawić opcje rozmów w innych językach (język główny, czy tłumaczyć i na jaki język). Szablon jest używany przez AI przy generowaniu odpowiedzi i może mieć dowolną formę. Możesz dodać instrukcje, np. że odpowiedzi mają być po angielsku. Wybierz, czy chcesz odpowiedzi krótkie, czy szczegółowe.
Przykład: Rozmowa rekrutacyjna analityka juniorskiego lub Rozmowa rekrutacyjna kierownika projektu w zagranicznej firmie. Odpowiedzi po angielsku.

Przykład:

Uruchom aplikację, utwórz szablon z tematem rozmowy, ustaw źródło dźwięku na Mikrofon, naciśnij zielony przycisk i zadaj pytanie. Z wersją rosyjskojęzyczną, gdy zobaczysz rozpoznany tekst na ekranie, naciśnij Otrzymaj odpowiedź, żeby zobaczyć odpowiedź. Z wersją wielojęzyczną powiedz pytanie i naciśnij Rozpoznaj teraz i otrzymaj odpowiedź. Możesz też znaleźć film z rozmową na YouTube, przejść do pytania, uruchomić aplikację, ustawić źródło na Głośniki, naciśnąć zielony i odtworzyć film — ten sam przebieg. Aplikacja działa tak samo podczas prawdziwej rozmowy online.

Tryb żądania odpowiedzi

Tryb ręczny. Mowa jest rozpoznawana automatycznie i pokazywana na czacie, ale odpowiedź jest żądana tylko po naciśnięciu Otrzymaj odpowiedź na dole. W pełni kontrolujesz, kiedy dostać odpowiedź.

Auto + ręczny (bez rąk). Aplikacja wykrywa, kiedy padło pytanie, i odpowiada. Wersja rosyjska: może być opóźnienie przy oczekiwaniu na pauzę do wykrycia końca mowy; użyj Otrzymaj odpowiedź dla natychmiastowej odpowiedzi z już rozpoznanego tekstu. Wersja wielojęzyczna: wykrywanie pytania i odpowiedź następują na końcu okresu rozpoznawania albo od razu po naciśnięciu Rozpoznaj.

Źródło dźwięku

Mowę można brać z różnych źródeł. Głośnik — rozpoznawanie tego, co jest odtwarzane w głośnikach (nie mikrofon). Mikrofon — rozpoznawanie tego, co mówisz do mikrofonu (nie z głośników). Do testów używaj mikrofonu; na prawdziwej rozmowie używaj głośnika, bo głos rekrutera idzie z głośników.

Głośnik. Tryb główny na rozmowy: głos jest rozpoznawany z tego, co idzie do głośników.

Mikrofon. Używaj do testów, gdy Ty zadajesz pytania jako rekruter.

Zadania na ekranie (live coding)

Pierwszy przycisk (ikona aparatu): zrób zrzut ekranu i wyciągnij tekst zadania. To jest shot. Domyślnie przechwytywany jest cały ekran.

Drugi przycisk (lupa): code review — pokazuje problemy i sugestie.

Możesz skopiować zadanie do schowka (np. jeśli nie mieści się na ekranie) i nacisnąć trzeci przycisk (notatnik), żeby użyć zawartości schowka zamiast zrzutu.

Skróty można włączyć w ustawieniach.

Tryby wolny i szybki
Domyślnie zrzuty używają tego samego modelu co rozmowa. Do trudniejszych zadań możesz przełączyć na model rozumowania (wolniejszy, do 30+ sekund). Kliknij nagłówek Shot, żeby przełączyć na Shot z rozumowaniem; kolejne kliknięcie wraca.
Model AI do shotów
W ustawieniach (u góry) możesz wybrać model AI do shotów. Niektóre zadania lepiej działają z konkretnymi modelami.

Skróty:

  • Alt + S — zrzut pełnego ekranu
  • Ctrl + S — zaznacz obszar do shotu
  • Alt + C — weź zadanie ze schowka
  • Ctrl + Alt + P — przełącz model shotu

Zadania, które nie mieszczą się na ekranie

Nie ma wbudowanego prostego rozwiązania. Obejściem jest wtyczka Chrome wysyłająca tekst strony do aplikacji na żądanie.

Instalator zawiera folder chrome_plugin z wtyczką i instrukcją. Po instalacji uruchom aplikację, otwórz stronę z zadaniem lub kodem w edytorze online. Trzymaj Shift (lub Ctrl, jeśli tekst jest w edytorze online); wokół panelu shot pojawi się ramka. Zielony znaczy połączony z wtyczką, żółty jeszcze nie (poczekaj kilka sekund). Ikona aparatu zmienia się na T, a lupa jest lustrzana, żeby odróżnić tryb. Gdy ramka jest zielona, używaj ikony T do zadań na ekranie lub lupy do code review.

Note: Uwaga: może nie działać na niektórych stronach. Zalecamy wyłączenie wtyczki po sesji; odpytywa aplikację co 10 sekund.

Rozmowy w innych językach

W formularzu tworzenia/edycji szablonu rozwiń sekcję Rozmowy w innych językach, żeby ustawić języki i opcje.

W Języki w dźwięku dodaj każdy język, który będzie używany, potem ustaw Język odpowiedzi, jeśli chcesz odpowiedzi w konkretnym języku. Możesz też poprosić o tłumaczenie pytania w odpowiedzi oraz opcjonalne tłumaczenie na żywo rozpoznanego tekstu (auto, po naciśnięciu przycisku lub oba).

Przykład

Prosty przypadek: rozmowa po niemiecku. Dodaj niemiecki do języków w dźwięku. Żeby dostać odpowiedzi po niemiecku i móc je odczytać, ustaw język odpowiedzi na niemiecki, zapisz i przetestuj (np. przez YouTube lub mikrofon).

Do rozpoznawania mowy zacznij od modelu Multistream — obsługuje wiele języków i daje tłumaczenie w czasie rzeczywistym.

Skontaktuj się z nami

Grupa użytkowników: t.me/hintsage_news

Wsparcie techniczne: t.me/hintsage_support