Begynn her

Publisert

Scribe fra Elevenlabs er best på transkribering

img of Scribe fra Elevenlabs er best på transkribering

Også tilgjengelig på

Elevenlabs er kjent for sine ledende tekst-til-tale-modeller som gjør det mulig å lage lyd fra tekst med en rekke stemmer og språk. Deres forsøk på også å tilby en modell som gjør det motsatte – å hente ut tekst fra en lydfil – har vært etterlengtet en stund. Lanseringen av Scribe har vært en suksess, med bedre nøyaktighet på transkribering enn alle konkurrerende modeller, inkludert Whisper fra OpenAI og varianter av denne.

Det er ukjent nøyaktig hvilken teknologi Elevenlabs bruker for sin modell. Det kan være en forbedret versjon av Whisper kombinert med avansert prosessering av lyden i forkant. Dette er sannsynlig, ettersom Scribe, akkurat som Whisper, støtter rundt 100 språk – noe som er mer enn de fleste alternative modeller på markedet. I motsetning til Whisper, tilbyr Scribe valgfri talergjenkjenning som identifiserer hvilken person som sier hva med høy presisjon. Modellen fra Elevenlabs støtter også andre “lydhendelser” som latter, applaus, bakgrunnsmusikk, osv. Det hevdes også at Scribe er bedre til å håndtere uperfekt tale, som stamming og mumling – noe som er svært vanlig i virkelige situasjoner der transkribering brukes profesjonelt.

Teksta.no har gjennomført en liten test for å se om påstandene stemmer, og det virker som de gjør det. Ved å bruke word-error-rate-verktøyet, kan du få data og visualisere hvor nøyaktig en transkripsjon er når du har en fasit å sammenligne med.

Per Kristian Bjørkeng i Aftenposten bekrefter også at Scribe fungerer bedre for journalister enn Whisper, som Schibsted har brukt i stor skala. I en svært interessant artikkel beskriver han hvordan han brukte KI-verktøy til å lage en løsning for transkribering med API-et til Elevenlabs uten å selv kunne programmere nettsider.

En rekke foretak i Norge bruker Autotekst fra UiO, som igjen bruker Whisper i kulissene. Dette er et godt verktøy som er svært nøyaktig, men ikke helt på samme høyde som Scribe. Autotekst tilbyr også varianter av Whisper utviklet av Nasjonalbiblioteket spesielt for norsk tale, men våre tester tyder på at disse ikke er bedre enn vanlig Whisper. Autotekst kan heller ikke ta i bruk Scribe, da lydfilene må sendes i Elevenlabs sine servere for å bli prosessert. Schibsted vil trolig utvikle et internt verktøy som tar i bruk Scribe, mens alle andre må bruke Elevenlabs direkte eller bruke Teksta.no eller en lignende tjeneste for den mest nøyaktige transkriberingen.

Elevenlabs tilbyr også API-tilgang til sine modeller, slik at andre selskaper kan bruke disse avanserte modellene i egne applikasjoner. Teksta.no har integrert Scribe for våre kunder slik at vi kan tilby markedets mest nøyaktige transkribering, i tillegg til alle andre verktøy for behandling, chatting og nedlasting av tekst.

Prøv Scribe hos Elevenlabs eller prøv det hos Teksta.no og se selv.

Prøv Teksta.no idag

La KI gjøre den kjedelige jobben og fokuser på mer givende arbeid.