Blog - Diaryzacja — nowa funkcja w Stenografie

Im więcej osób uczestniczy w nagraniu, tym trudniej je spisać, dlatego teraz Stenograf automatycznie dokonuje podziału na mówców. Sprawdź, jak działa nowa funkcjonalność!

Transkrypcja nagrania z podziałem na mówców

W przypadku zwyczajnych rozmów, podcastów czy też wywiadów komunikacja przebiega bardzo różnie: czasem spokojnie, a czasem burzliwie. Wyodrębnienie poszczególnych rozmówców i przypisanie ich do poszczególnych wypowiedzi wymaga poświęcenia dodatkowego czasu, przez co cały proces przygotowania tekstu transkrypcji się wydłuża.

Wychodząc naprzeciw użytkownikom Stenografu i ich oczekiwaniom postanowiliśmy wzbogacić Stenograf w nową funkcję — automatyczną diaryzację mówców. Diaryzacja polega na rozróżnianiu mówców na nagraniu, dzięki czemu znacząco ułatwi pracę z transkrypcjami nagrań.

Rozpoznani mówcy są nazywani automatycznie jako „SPEAKER_00”, „SPEAKER_01” itd., ale można te nazwy edytować i wprowadzać nowe np. konkretne imię i nazwisko prelegenta. Taka zmiana znacznie ułatwia pracę nad transkrypcjami wywiadów, debat, dyskusji i pozwala ją znacznie przyspieszyć.

Diaryzacja jest szczególnie ważna i użyteczna w pracy dziennikarzy, psychologów czy badaczy, którzy pracują ze znaczącą ilością danych głosowych. W ich działaniach niezbędne jest właściwe określenie mówców do pozyskiwania i analizowania treści wypowiedzi.

Jak narzędzie Stenograf pozwala na dodawanie i zmiany mówców w transkrypcji nagrania

Mając przed sobą tekst transkrypcji w widoku transkrypcji aplikacji Stenograf widoczny jest podział na mówców. Domyślnie są to po prostu rosnące nazwy od „SPEAKER_00” oraz posiadające indywidualne kolory, aby łatwiej pracowało się z tekstem transkrypcji.

Widok początkowy przed zmianami mówców.webp

Aby zmienić nazwę mówcy należy kliknąć jego domyślną nazwę. Wyświetli się lista, na której należy kliknąć ikonę ołówka obok nazwy mówcy, którą chcemy edytować. Zmieniamy ją i zapisujemy klikając ptaszek obok wpisanej nazwy. Wprowadzona zmiana zostanie zastosowana do wszystkich kwestii wypowiedzianych przez danego mówcę w całym zapisie transkrypcji.

Może zdarzyć się, że będzie potrzeba dodać kolejnego mówcę w konkretnym miejscu zapisu tekstu transkrypcji. Aby tego dokonać wystarczy kliknąć w docelowym miejscu i nacisnąć klawisz „Enter” - linia zostanie przełamana i zostanie dodany znacznik czasowy wraz z nazwą mówcy, którego treść wypowiedzi przełamaliśmy.

Dodawanie kolejnego mówcy w określonym miejscu.webp

Teraz należy kliknąć nazwę mówcy, wybrać „Dodaj mówcę” i postępować analogicznie jak przy zmianie nazwy.

Po wykonaniu powyższych czynności dodana nazwa będzie odznaczała się również indywidualnym kolorem.

Widok po wszystkich zmianach mówców.webp

Podział na role w aplikacji Stenograf ułatwi przygotowanie transkrypcji i jeszcze bardziej skróci czas pracy z zapisem transkrypcji nagrań dźwięku. Zamiana mowy na tekst staje się coraz prostsza ze Stenografem!

Zamiana mówców i korekty w transkrypcji

Mogą zdarzyć się sytuacje, gdzie zmiana tonu, wahania głośności lub błędna identyfikacja mówcy spowoduje nieprawidłowe przypisanie treści do mówcy. Można to bardzo łatwo skorygować.

Ustaw kursor w miejscu tekstu, który chcesz przypisać do poprzedniego mówcy lub scalić w jedną wypowiedź mówcy i kliknij „Backspace” na klawiaturze. Tekst zostanie przeniesiony do sekcji powyżej i przypisany do danego mówcy jak na grafice poniżej.

Jeżeli potrzebujesz zmienić mówcę, gdyż nieprawidłowo został przypisany do kwesti kliknij na nazwę mówcy i z rozwiniętego menu wybierz lektora odpowiadającego za daną wypowiedź.

Przypominamy, że diaryzacja to kolejna funkcjonalność wprowadzona do Stenografu. Niedawno informowaliśmy Was, że w naszej aplikacji automatycznie generuje się interpunkcja. Oczywiście, to nie koniec i możecie spodziewać się kolejnych usprawnień aplikacji Stenograf już wkrótce.

Stenograf to nie tylko narzędzie do tworzenia transkrypcji nagrań audio i wideo, to także zespół, który chętnie pomoże we wszystkich kwestiach związanych z napisami do filmów, transkrypcjami dźwięku czy tłumaczeniami. Jesteśmy otwarci na sugestie użytkowników i klientów Stenografu. Zapraszamy do kontaktu i zapoznania się z naszą ofertą.

Paweł CyrtaHead of Voice AI @ Stenograf

Paweł Cyrta — ekspert ds. detekcji audio deepfake oraz systemów biometrii głosowej. Jako Head of Voice AI w Stenograf odpowiada za rozwój silników Automatic Speech Recognition (ASR) oraz autorskiego modelu Audio Deepfake Detection (ADD), który osiąga 89% skuteczności w wykrywaniu klonowania głosu w warunkach rzeczywistych (benchmark Deepfake-Eval-2024).

Specjalizuje się w technologiach voice anti-spoofing oraz projektowaniu systemów chroniących organizacje przed atakami typu CEO Fraud i Voice Phishing. Dzięki połączeniu kompetencji w obszarze Machine Learning (Deep Learning, Transformers) z inżynierią sygnału audio, tworzy narzędzia zdolne do wykrywania manipulacji akustycznych niesłyszalnych dla ludzkiego ucha.

Transkrypcja nagrań z podziałem na mówców — nowa funkcja w Stenografie

Transkrypcja nagrania z podziałem na mówców

Jak narzędzie Stenograf pozwala na dodawanie i zmiany mówców w transkrypcji nagrania

Zamiana mówców i korekty w transkrypcji

Chcesz rozpocząć?Otrzymuj doskonałetranskrypcje od ręki!Korzystaj z polskiej technologiiwspółpracuj z polskim zespołem!

Zobacz również