Transkrybuj – nowy przycisk na wstążce w Wordzie

Posiadam pakiet Office 365. Co jakiś czas programy pakietu Office są wzbogacane o nowe polecenia. Niedawno zauważyłem na karcie Narzędzia główne w grupie poleceń Głos dwa nowe polecenia: Transkrybuj oraz Czytaj na głos.

Ciekawostka: owe narzędzie znajduje się również w przeglądarkowej wersji pakietu Office!

Polecenie Transkrybuj pozwala zamienić plik audio (wav, mp3, m4a, mp4) na tekst w Wordzie. Można również rozpocząć nagrywanie. Według dokumentacji można w ten sposób „przelać na papier” wcześniej nagraną rozmowę kwalifikacyjną. Ja natomiast widzę tutaj inne ciekawe zastosowanie: otóż jestem wzrokowcem i lubię czytać tekst, natomiast wszelkiej maści podcastów nie słucham. Czasem twórcy treści na swoim blogu oprócz podcastu publikują transkrypt (często transkrypt pojawia się dopiero po jakimś czasie). Dawniej należało komuś zapłacić, aby przepisał podcast do formy tekstowej, teraz wystarczy mieć najnowszy pakiet MS Office.

Na początek drobna uwaga techniczna: na chwilę obecną możemy przetranskrybować 300 minut nagrań miesięcznie.

Uwaga: Dane są wysyłane na serwery Microsoftu, więc nie używałbym tego narzędzia do transkrypcji jakiś treści zawierających tajemnice firmowe. Natomiast to narzędzie świetnie się sprawdza, aby transkrybować podcasty. Również osoby głuche ucieszą się, że mogą zamienić dowolny plik audio na tekst!

Jak to działa? Otóż na razie tak średnio. Postanowiłem na początek wrzucić jakąś piosenkę. O dziwo narzędzie poradziło sobie z tym całkiem sprawnie, większość tekstu rozpoznało bezbłędnie, ale niektóre wyrazy zostały niepoprawnie rozpoznane. Zauważyłem, że pewne nierozpoznane wyrazy nie są dodawane do transkrypcji. No, ale piosenka to nie mowa, więc tutaj nie będę się za bardzo czepiał.

Ponieważ nie chciałem nagrywać swojego głosu postanowiłem ściągnąć przykładowy filmik z YouTube. Na warsztat wziąłem nagranie: Threema wcale nie taka bezpieczna? z kanału Mateusz Chrobok. I tutaj już było znacznie lepiej, ale też niektóre wyrazy nie zostały poprawnie rozpoznane. Czasami wyrazy anglojęzyczne zostały przekręcone (ale tu nie będę się czepiał, wszak jako język wejściowy wybrałem polski, a że filmik zawierał anglojęzyczne terminy to już inna sprawa). Tutaj jeszcze dodam, że pobrany filmik był w formie shorta (czyli twórca ze swoim przekazem musiał się zmieścić w czasie 60 sekund) więc i tempo lektora było dość szybkie. Oto jak wygląda proces transkrypcji:

W skrócie: u góry mamy odtwarzacz. Pod odtwarzaczem jest tekst podzielony na sekcje. Klikając w daną sygnaturę czasową odtwarzamy nagranie od danego miejsca (np. w 00:00:12). Możemy również najechać na dowolną sekcję i kliknąć w ikonkę ołówka aby ją edytować (np. poprawić błędnie rozpoznane wyrazy).

Na samym dole panelu również znajduje się również przycisk, który pozwala na dodanie transkrypcji do aktywnie edytowanego dokumentu (sam tekst, tekst z nazwami prelegentów, tekst z sygnaturami czasowymi jak również tekst z nazwami prelegentów i sygnaturami).

Podsumowując: ostatnio coraz modniejsza staje się sztuczna inteligencja (jak przeglądam serwisy z newsami to mam wrażenie, że wszyscy zwariowali na punkcie DALL E 2, OpenAI czy też VALL-E). Jak widać firma Microsoft nie stoi w tyle i stara się wykorzystać nowinki technologiczne do ulepszania swoich produktów.

Jeśli artykuł Ci się podobał, będę wdzięczny gdy go udostępnisz w mediach społecznościowych
Ten wpis został opublikowany w kategorii sztuczki i oznaczony tagami , , . Dodaj zakładkę do bezpośredniego odnośnika.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Witryna wykorzystuje Akismet, aby ograniczyć spam. Dowiedz się więcej jak przetwarzane są dane komentarzy.