In eerdere onderwerpen zijn we uitgebreid in gegaan op hoe we geluid om konden zetten naar tekst. Daar zijn we in geslaagd. Maar.. dan blijkt dat je een enorme woordenbrij terug krijgt waar niet doorheen te ploegen valt als lezer. Gelukkig hebben we daar AI voor die dat wel kan en er een mooie, strakke tekst van maakt met alinea’s en meer zonder afbreuk te doen aan het origineel. En dan kan het nog een heel verhaal zijn dus we vragen om er ook nog een mooie samenvatting van te laten maken. Dan leest het pas lekker weg.
Bedenk wel dat dit allemaal automatisch gaat zodra dit geprogrammeerd is in/met Python. Nadat het programma gestart is komt er geen mens meer aan te pas en doet de Raspberry zijn werk. Dus: luisteren, omzetten naar tekst, plooien en samenvatten.
Voor morgenavond hebben we de Vallei Ronde op 145,250 MHz ‘in het vizier’ en gaan we de praktijk in. De bedoeling is dat de Raspberry een half uurtje maximaal mee gaat doen om eens te kijken wat het er van bakt. Fouten kunnen en zullen voorkomen. Het is de bedoeling om er van de leren en waar nodig te verbeteren.
Om een samenvatting te genereren gebruiken we de volgende prompt:
summary_prompt = “Analyseer dit zendamateurgesprek. Het gesprek bestaat uit een ronde waarbij zendamateurs zich één voor één aanmelden met hun roepnaam (callsign). De rondeleider herhaalt vaak de gehoorde roepnamen en vraagt om meer aanmeldingen. Soms volgen er verhalen tussen de aanmeldingsrondes door. Maak een aparte lijst met aangemelde zendamateurs. Een zendamateur (callsign) kan maar één keer voorkomen in de lijst. Geef een samenvatting van het gesprek in de vorm van een lijst met de belangrijkste punten. Presenteer vervolgens de besproken onderwerpen als een aparte, genummerde lijst.”
Voor gestructureerde tekst:
correction_prompt = (“Corrigeer de volgende transcriptie. Verwijder stopwoorden zoals ‘uh’, ‘uhm’, en ‘ah'”
“Herformuleer onafgemaakte of kromme zinnen zodat ze grammaticaal correct en goed leesbaar zijn. “
“Voeg de losse zinnen samen tot een lopend verhaal per spreker. Behoud de spreker-tags (bijv. ‘Spreker 1:’) en de oorspronkelijke betekenis.”)

