Wsparcie techniczne: telegram.me/hintsage_support

Pierwsze uruchomienie

Przy pierwszym uruchomieniu otrzymujesz darmowy czas na wersje multistream i wielojęzyczną, żeby je wypróbować.

Multistream

Szybki model rozpoznający i wyświetlający mowę w czasie rzeczywistym, obsługujący inne języki.

Wersja wielojęzyczna

Najpierw zapisuje dźwięk, potem go rozpoznaje. Do rozmów i zadań z terminami w innych językach. Pokazuje rozpoznany tekst z krótkim opóźnieniem.

Potem możesz wybrać, która wersja Ci pasuje, i używać tylko jej.

Przełączanie modelu języka jest w opcjach (ikona zębatki w lewym górnym rogu). Zobacz sekcję Ustawienia poniżej.

Przegląd interfejsu

Wszystkie przyciski pokazują swój aktualny stan.

Przycisk Start. Naciśnij, żeby rozpocząć sesję i uruchomić rozpoznawanie mowy.

Przed startem wybierz lub utwórz szablon: opisz temat rozmowy i inne przydatne informacje. Możesz też ustawić opcje rozmów w innych językach (język główny, czy tłumaczyć i na jaki język). Szablon jest używany przez AI przy generowaniu odpowiedzi i może mieć dowolną formę. Możesz dodać instrukcje, np. że odpowiedzi mają być po angielsku. Wybierz, czy chcesz odpowiedzi krótkie, czy szczegółowe.

Tutaj możesz też ustawić opcje rozmów w języku obcym: język główny i czy tłumaczyć tekst oraz na jaki język.

Szablon jest używany przez AI przy generowaniu odpowiedzi i może być w dowolnej formie. Możesz dodać instrukcje np. „odpowiedzi po angielsku”. Wybierz odpowiedzi krótkie lub szczegółowe.

Przykład szablonu: "Rozmowa rekrutacyjna junior analyst" lub "Rozmowa project manager w firmie zagranicznej. Odpowiedzi po angielsku."

Przykład:

Uruchom aplikację, utwórz szablon z tematem rozmowy, ustaw źródło dźwięku na Mikrofon, naciśnij zielony przycisk i zadaj pytanie. W wersji multistream, gdy zobaczysz rozpoznany tekst na ekranie, naciśnij Pobierz odpowiedź. W wersji wielojęzycznej powiedz pytanie i naciśnij Rozpoznaj teraz i pobierz odpowiedź. Możesz też znaleźć film z rozmową na YouTube, przejść do pytania, uruchomić aplikację, źródło Głośniki, zielony i odtwórz — ten sam przebieg. Aplikacja działa tak samo podczas prawdziwej rozmowy online.

Tryb żądania odpowiedzi

Tryb ręczny. Mowa jest rozpoznawana automatycznie i pokazywana na czacie, ale odpowiedź jest żądana tylko po naciśnięciu Otrzymaj odpowiedź na dole. W pełni kontrolujesz, kiedy dostać odpowiedź.

Auto + ręczny (hands-free). Aplikacja wykrywa, kiedy padło pytanie, i odpowiada. Multistream: może wystąpić opóźnienie w oczekiwaniu na pauzę wykrycia końca wypowiedzi; użyj Pobierz odpowiedź, aby od razu dostać odpowiedź z już rozpoznanego tekstu. Wersja wielojęzyczna: wykrywanie pytania i odpowiedź następują na końcu okresu rozpoznawania lub od razu po naciśnięciu Rozpoznaj.

Źródło dźwięku

Mowę można brać z różnych źródeł. Głośnik — rozpoznawanie tego, co jest odtwarzane w głośnikach (nie mikrofon). Mikrofon — rozpoznawanie tego, co mówisz do mikrofonu (nie z głośników). Do testów używaj mikrofonu; na prawdziwej rozmowie używaj głośnika, bo głos rekrutera idzie z głośników.

🔊

Głośnik. Tryb główny na rozmowy: głos jest rozpoznawany z tego, co idzie do głośników.

🎙

Mikrofon. Używaj do testów, gdy Ty zadajesz pytania jako rekruter.

Shoty

📸

Gdy naciśniesz pierwszy przycisk (ikona aparatu), wykonywany jest zrzut ekranu i wyszukiwany jest tekst zadania. Ta operacja nazywa się „Shot”.

Domyślnie przechwytywany jest cały ekran.

Drugi przycisk (lupa): code review — pokazuje problemy i sugestie.

Możesz skopiować zadanie do schowka (np. jeśli nie mieści się na ekranie) i nacisnąć trzeci przycisk (notatnik), żeby użyć zawartości schowka zamiast zrzutu.

Skróty można włączyć w ustawieniach.

Tryby wolny i szybki

Domyślnie zrzuty używają tego samego modelu co rozmowa. Do trudniejszych zadań możesz przełączyć na model rozumowania (wolniejszy, do 30+ sekund). Kliknij nagłówek Shot, żeby przełączyć na Shot z rozumowaniem; kolejne kliknięcie wraca.

Model AI do shotów

W ustawieniach (u góry) możesz wybrać model AI do shotów. Niektóre zadania lepiej działają z konkretnymi modelami.

Skróty:

Alt + S — zrzut pełnego ekranu
Ctrl + S — zaznacz obszar do shotu
Alt + C — weź zadanie ze schowka
Ctrl + Alt + P — przełącz model shotu

Zadania, które nie mieszczą się na ekranie

Nie ma wbudowanego prostego rozwiązania. Obejściem jest wtyczka Chrome wysyłająca tekst strony do aplikacji na żądanie.

Instalator zawiera folder chrome_plugin z wtyczką i instrukcją. Po instalacji uruchom aplikację, otwórz stronę z zadaniem lub kodem w edytorze online. Trzymaj Shift (lub Ctrl, jeśli tekst jest w edytorze online); wokół panelu shot pojawi się ramka. Zielony znaczy połączony z wtyczką, żółty jeszcze nie (poczekaj kilka sekund). Ikona aparatu zmienia się na T, a lupa jest lustrzana, żeby odróżnić tryb. Gdy ramka jest zielona, używaj ikony T do zadań na ekranie lub lupy do code review.

Instalator zawiera folder chrome_plugin (w katalogu instalacji).

Zawiera wtyczkę i instrukcję instalacji.

Po instalacji uruchom aplikację i otwórz stronę z zadaniem lub kodem w edytorze online.

Przytrzymaj Shift (lub Ctrl, jeśli tekst jest w edytorze online) — wokół panelu shotów pojawi się ramka.

Zielony = połączono z wtyczką; żółty = jeszcze nie (poczekaj chwilę).

Ikony się zmieniają — aparat na T, lupa w odbiciu.

Gdy ramka będzie zielona, naciśnij potrzebny przycisk.

Uwaga! Może nie działać na niektórych stronach. Rozwiązanie nie jest idealne, ale lepsze niż nic.

Zalecamy wyłączenie wtyczki po sesji. Co 10 sekund próbuje łączyć się z aplikacją, choć tego nie widać.

Ustawienia programu (⚙️)

₽Saldo

Saldo i subskrypcje — doładuj wersję rosyjskojęzyczną lub kup subskrypcję wersji wielojęzycznej.

⚙️Ogólne

Tu są główne opcje zachowania: odpowiedź po najechaniu, ochrona kursora i inne opcje.

Otrzymaj odpowiedź przy najechaniu — kliknij przycisk odpowiedzi, najechawszy na niego kursorem, żeby używać aplikacji w trybie cichym.
Tryb ochrony kursora — gdy włączony, kursor nie zmienia się nad oknem aplikacji; gdy wyłączony, zmienia się na strzałkę.

🎙Źródło i model głosu

Tu ustawiasz źródła dźwięku i model rozpoznawania mowy.

Model głosu (multistream, wielojęzyczny)

Multistream rozpoznaje i wyświetla mowę w czasie rzeczywistym i obsługuje wiele języków obcych.

Model wielojęzyczny Najpierw zapisuje dźwięk, potem go rozpoznaje. Nie działa w czasie rzeczywistym, więc są trzy tryby:

1. Po okresie. Po uruchomieniu sesji aplikacja buforuje dźwięk co 10 sekund i rozpoznaje go na czacie. Pewne nakładanie na granicach okresów jest normalne. Długość okresu można zmienić w konfigu: MULTILANG_MODEL_PERIOD_SEC, zakres 10–30 s.

2. Po ciszy. Po uruchomieniu sesji aplikacja buforuje dźwięk i rozpoznaje przy ciszy (pauzie). Długość pauzy można ustawić w ustawieniach.

3. Ręczny start/stop. Ty decydujesz, kiedy rozpocząć i zakończyć nagrywanie. Użyj, gdy zaczynasz przed pytaniem i kończysz po. Dźwięk jest transkrybowany i generowana jest odpowiedź.

Żeby uruchomić/zatrzymać nagrywanie, użyj ALT-E lub zielonego/czerwonego przycisku. Maks. ciągłe nagrywanie to 2 minuty; rozpoznawanie działa najlepiej z fragmentami do 30 sekund.

💬Typ czatu

Here you choose the chat type that best suits you functionally and visually.

Avalon

By default Avalon is used.

RichText

If you need more themes for code, you can choose RichText.

Internal Browser

If you need support for formulas, UML diagrams, and system design diagrams, choose Internal Browser.

🗨️Chat

Here you can choose the chat style: two ways to display the conversation with the AI.

Message feed

A continuous thread you can scroll up and down. New messages appear at the bottom and push older ones up.

Single answer on screen

After each AI reply the chat clears and the new answer is shown at the top. Use the History button to open the full chat and scroll back through earlier messages.

📸Shoty (zadania na ekranie)

Tu możesz wybrać model AI do shotów. Do zadań algorytmicznych i matematycznych polecamy Claude 4. Możesz też ustawić monitor do shotów przy wielu monitorach.

🔊Dźwięk

Ustawienia dźwięku — jeśli rozpoznawanie nie działa, wybierz tu właściwe urządzenia głośnika i mikrofonu.

⌨️Skróty

Tu możesz zobaczyć bieżące skróty i zmienić kombinacje. Tryb ochrony kursora i okna phantom opisano osobno.

Tryb ochrony kursora. W tym trybie kursor nie zmienia się nad oknem i podąża za elementami za nim. Nadal możesz klikać elementy głównego okna. Przy otwieraniu opcji lub wyborze szablonu kursor przełączy się na strzałkę.
Tryb okna widma. Okno jest w pełni przezroczyste dla ruchów i kliknięć myszy. Zostaje na ekranie, ale wszystkie działania myszy przechodzą przez nie. Sterujesz skrótami.
Kursor wirtualny. Po włączeniu pojawia się drugi żółty kursor. Ten kursor i główne okno są niewidoczne; sterujesz kursorem wirtualnym, aż wyłączysz tryb. Prawdziwy kursor zostaje w miejscu. Działa tylko z włączonym trybem ochrony kursora.

Baza wiedzy

The knowledge base lets you upload documents the AI should rely on when answering.

If you already have reference answers and theory, upload them here.

Answers that use the knowledge base take longer than a normal answer. You can enable a separate button to request an AI answer with the knowledge base.

If the knowledge base answer is large enough (more than about 3000-3500 characters), it may be truncated. Store answers in a more compact form.

At the moment, the knowledge base size is limited to 20 MB of plain text.

How the knowledge base differs from a template

Knowledge base

The answer is retrieved based on the question — whatever was asked is what is looked up in the knowledge base.

Template

The neural network always applies the template; it does not depend on the question and may contain instructions and commands for the model.

Detailed videos and walkthroughs are in the Video section, and on the home page in the Knowledge base block.

🕒Sesje

Zobacz historię sesji w przeglądarce

Rozmowy w innych językach

W formularzu tworzenia/edycji szablonu rozwiń sekcję Rozmowy w innych językach, żeby ustawić języki i opcje.

W polu języków w dźwięku wpisz każdy język, kliknij Dodaj, potem następny itd.

Jeśli potrzebujesz odpowiedzi w konkretnym języku, ustaw „Język odpowiedzi”.

Jeśli potrzebujesz tłumaczenia pytania przed odpowiedzią, ustaw „W odpowiedzi podać też tłumaczenie pytania na”.

Do tłumaczenia na żywo fraz wpisz język w „Tłumacz rozpoznany tekst na”. Tryby: automatyczny, na przycisk lub oba.

Przykład

Prosty przypadek: rozmowa po niemiecku. Dodaj niemiecki do języków w dźwięku. Żeby dostać odpowiedzi po niemiecku i móc je odczytać, ustaw język odpowiedzi na niemiecki, zapisz i przetestuj (np. przez YouTube lub mikrofon).

Do rozpoznawania mowy zacznij od modelu Multistream — obsługuje wiele języków i daje tłumaczenie w czasie rzeczywistym.

Skontaktuj się z nami

Grupa użytkowników: telegram.me/hintsage_news

Wsparcie techniczne: telegram.me/hintsage_support