Transkrypcja nagrań z podziałem na mówców — nowa funkcja w Stenografie
Im więcej osób uczestniczy w nagraniu, tym trudniej je spisać, dlatego teraz Stenograf automatycznie dokonuje podziału na mówców. Sprawdź, jak działa nowa funkcjonalność!
Transkrypcja nagrania z podziałem na mówców
W przypadku zwyczajnych rozmów, podcastów czy też wywiadów komunikacja przebiega bardzo różnie: czasem spokojnie, a czasem burzliwie. Wyodrębnienie poszczególnych rozmówców i przypisanie ich do poszczególnych wypowiedzi wymaga poświęcenia dodatkowego czasu, przez co cały proces przygotowania tekstu transkrypcji się wydłuża.
Wychodząc naprzeciw użytkownikom Stenografu i ich oczekiwaniom postanowiliśmy wzbogacić Stenograf w nową funkcję — automatyczną diaryzację mówców. Diaryzacja polega na rozróżnianiu mówców na nagraniu, dzięki czemu znacząco ułatwi pracę z transkrypcjami nagrań.
Rozpoznani mówcy są nazywani automatycznie jako „SPEAKER_00”, „SPEAKER_01” itd., ale można te nazwy edytować i wprowadzać nowe np. konkretne imię i nazwisko prelegenta. Taka zmiana znacznie ułatwia pracę nad transkrypcjami wywiadów, debat, dyskusji i pozwala ją znacznie przyspieszyć.
Diaryzacja jest szczególnie ważna i użyteczna w pracy dziennikarzy, psychologów czy badaczy, którzy pracują ze znaczącą ilością danych głosowych. W ich działaniach niezbędne jest właściwe określenie mówców do pozyskiwania i analizowania treści wypowiedzi.
Jak narzędzie Stenograf pozwala na dodawanie i zmiany mówców w transkrypcji nagrania
Mając przed sobą tekst transkrypcji w widoku transkrypcji aplikacji Stenograf widoczny jest podział na mówców. Domyślnie są to po prostu rosnące nazwy od „SPEAKER_00” oraz posiadające indywidualne kolory, aby łatwiej pracowało się z tekstem transkrypcji.
Aby zmienić nazwę mówcy należy kliknąć jego domyślną nazwę. Wyświetli się lista, na której należy kliknąć ikonę ołówka obok nazwy mówcy, którą chcemy edytować. Zmieniamy ją i zapisujemy klikając ptaszek obok wpisanej nazwy. Wprowadzona zmiana zostanie zastosowana do wszystkich kwestii wypowiedzianych przez danego mówcę w całym zapisie transkrypcji.
Może zdarzyć się, że będzie potrzeba dodać kolejnego mówcę w konkretnym miejscu zapisu tekstu transkrypcji. Aby tego dokonać wystarczy kliknąć w docelowym miejscu i nacisnąć klawisz „Enter” - linia zostanie przełamana i zostanie dodany znacznik czasowy wraz z nazwą mówcy, którego treść wypowiedzi przełamaliśmy.
Teraz należy kliknąć nazwę mówcy, wybrać „Dodaj mówcę” i postępować analogicznie jak przy zmianie nazwy.
Po wykonaniu powyższych czynności dodana nazwa będzie odznaczała się również indywidualnym kolorem.
Podział na role w aplikacji Stenograf ułatwi przygotowanie transkrypcji i jeszcze bardziej skróci czas pracy z zapisem transkrypcji nagrań dźwięku. Zamiana mowy na tekst staje się coraz prostsza ze Stenografem!
Zamiana mówców i korekty w transkrypcji
Mogą zdarzyć się sytuacje, gdzie zmiana tonu, wahania głośności lub błędna identyfikacja mówcy spowoduje nieprawidłowe przypisanie treści do mówcy. Można to bardzo łatwo skorygować.
Ustaw kursor w miejscu tekstu, który chcesz przypisać do poprzedniego mówcy lub scalić w jedną wypowiedź mówcy i kliknij „Backspace” na klawiaturze. Tekst zostanie przeniesiony do sekcji powyżej i przypisany do danego mówcy jak na grafice poniżej.
Jeżeli potrzebujesz zmienić mówcę, gdyż nieprawidłowo został przypisany do kwesti kliknij na nazwę mówcy i z rozwiniętego menu wybierz lektora odpowiadającego za daną wypowiedź.
Przypominamy, że diaryzacja to kolejna funkcjonalność wprowadzona do Stenografu. Niedawno informowaliśmy Was, że w naszej aplikacji automatycznie generuje się interpunkcja. Oczywiście, to nie koniec i możecie spodziewać się kolejnych usprawnień aplikacji Stenograf już wkrótce.
Stenograf to nie tylko narzędzie do tworzenia transkrypcji nagrań audio i wideo, to także zespół, który chętnie pomoże we wszystkich kwestiach związanych z napisami do filmów, transkrypcjami dźwięku czy tłumaczeniami. Jesteśmy otwarci na sugestie użytkowników i klientów Stenografu. Zapraszamy do kontaktu i zapoznania się z naszą ofertą.
Paweł Cyrta — ekspert ds. detekcji audio deepfake oraz systemów biometrii głosowej. Jako Head of Voice AI w Stenograf odpowiada za rozwój silników Automatic Speech Recognition (ASR) oraz autorskiego modelu Audio Deepfake Detection (ADD), który osiąga 89% skuteczności w wykrywaniu klonowania głosu w warunkach rzeczywistych (benchmark Deepfake-Eval-2024).
Specjalizuje się w technologiach voice anti-spoofing oraz projektowaniu systemów chroniących organizacje przed atakami typu CEO Fraud i Voice Phishing. Dzięki połączeniu kompetencji w obszarze Machine Learning (Deep Learning, Transformers) z inżynierią sygnału audio, tworzy narzędzia zdolne do wykrywania manipulacji akustycznych niesłyszalnych dla ludzkiego ucha.

