Uitdaging

Hoe meer informatie en kennis uit de audiovisuele inhoud van het Digitale Overheidscongres te halen en hoe deze toegankelijker te maken voor gebruikers.

Huidige problemen

De conferenties, seminars, workshops en andere informatieve activiteiten die door de AOC worden georganiseerd om de digitale transformatie en innovatie van de Catalaanse overheidsdiensten te bevorderen, genereren een grote hoeveelheid audiovisuele inhoud die niet altijd goed wordt gebruikt om informatie en kennis te extraheren.

Dit feit is verergerd door de pandemie die ons heeft gedwongen onze gewoonten, routines en manieren van omgaan van de ene op de andere dag te veranderen, zodat in korte tijd het aantal activiteiten in lijn (vergaderingen, conferenties en congressen) exponentieel is toegenomen en nu we hebben een enorme hoeveelheid video's, spraakmemo's en teksten die we niet kunnen verwerken.

Naast de pandemie zijn er nog andere factoren die het digitaliseringsproces van evenementen en activiteiten hebben versneld:

  • Gemakkelijke toegang tot vergaderingen, het comfort en de verlaging van de organisatiekosten dankzij een veel eenvoudigere logistiek.
  • Technologische vooruitgang die de online gebruikerservaring steeds beter maakt, waardoor nauwkeurige publieksanalyse en gegevenscontrole mogelijk zijn.
  • De vermindering van de COXNUMX-uitstoot als gevolg van het vermijden van verplaatsingen van de aanwezigen.

Zozeer zelfs dat in 2021 de Digitaal Overheidscongres om de twee jaar georganiseerd door het AOC, ging het van 100% face-to-face naar een hybride format, met presentatoren en sprekers op het podium en een virtueel publiek.

We realiseerden ons meteen dat een eenvoudig "Video on Demand"-platform, zoals YouTube, niet zou volstaan ​​om te profiteren van de grote hoeveelheid audiovisuele inhoud die voor, tijdens en na het congres zou worden gegenereerd, noch om de meer toegankelijke kennis . Er was ook een uitdaging: het verzamelen van gegevens van gebruikers en hun interesses op basis van hun browsen, om hun behoeften en verwachtingen beter te begrijpen en om het inhoudsprogramma opnieuw te kunnen ontwerpen voor toekomstige evenementen.

Dus gingen we op zoek naar een tool of marktdienst die video's, spraaknotities en teksten kon verwerken en analyseren met behulp van kunstmatige-intelligentietechnieken, om informatie en kennis te extraheren en deze zo toegankelijk mogelijk te maken.

Voorgestelde oplossing

De toegepaste oplossing kwam van Omnios, een Catalaanse technologische startup geboren in Barcelona in 2019 die een intelligente informatieverwerkingsservice heeft ontwikkeld die grote hoeveelheden audiovisuele inhoud toegankelijk maakt; Winnow door Omnios: Het intelligente Video On Demand-platform.

Wat is Winnow?

Een slim videoplatform dat u helpt bij het navigeren door uw media-inhoud. De video's en presentaties daarin zijn voorbewerkt met behulp van kunstmatige-intelligentietechnieken zoals stem- en persoonsherkenning, tekstmining en inhoudscategorisatie; om er kennis uit te halen en verbanden te kunnen leggen tussen de besproken concepten.

Belangrijkste functionaliteiten:

Het platform biedt:

  • Slimme kaarten van kennis

    Wanneer een video wordt geüpload, genereert het systeem automatisch interactieve kaarten. Deze kaarten zijn de extractie van de inhoud en kunnen zowel worden gebruikt om te vergelijken wat elke spreker heeft gezegd als om te navigeren door de video's en onderwerpen te vergelijken. De grootte van de cirkel hangt in principe af van de frequentie en het belang van het concept ten opzichte van de video, en de pijlen betekenen een directe relatie tussen sprekers en concepten. Kaarten kunnen worden verkend volgens: trefwoorden | Merken of entiteiten | Locaties | mensen

Wat zijn Winnow Knowledge Maps?

Interactieve grafieken die helpen de kennis te begrijpen die Winnow automatisch extraheert uit de inhoud die het verwerkt (video's en presentaties). Het systeem begrijpt hoe verschillende papieren zich tot elkaar verhouden, vindt verbanden tussen concepten en mensen en onderzoekt nieuwe en diepere verbanden.

Het biedt ook:

  • Un slimme zoekmachine om via trefwoorden het exacte moment te kunnen zoeken waarop een specifiek onderwerp aan de orde is, waardoor u niet hoeft te zoeken in delen van de video die niet van belang zijn.
  • Spraakherkenning van sprekers: Met behulp van kunstmatige intelligentie kan het platform op elk moment herkennen wie er aan het woord is, waardoor de spraak kan worden gesegmenteerd en elk stuk kan worden toegewezen aan een specifieke persoon.
  • Download het transcript van de video in verschillende talen. La plataforma té la capacitat d'entendre el video o nota de veu i permet descarregar tota la transcripció en català, castellà i anglès, en format de document o bé mitjançant subtítols.
  • classificatie intelligent van alle video's en automatische "tagging".
  • Inhoud en gebruikersanalyse (door Google Analytics): ze kunnen worden gebruikt om gebruikers beter te leren kennen op basis van hun navigatie; begrijpen wat ze vragen en willen.

Proof of concept en pilot

Het AOC-consortium lanceerde een proefproject om de voordelen en voordelen van AI te testen die worden toegepast op de audiovisuele inhoud van de CGD2021, terwijl de resulterende video's en presentaties van het congres worden verwerkt met de Winnow-service.

In totaal werden 162 inhoudsopgaven verwerkt, inclusief video's van de sessies (80) en ondersteunende documenten van de presentaties in pdf-formaat.

Op 25-11-2021 werd toegang tot de Winnow-service ingeschakeld via de CGD 2021-platform die 6 maanden operationeel was.

uitslagen

Gedurende de tijd dat de pilot operationeel is, hebben zij het platform betreden 167 unieke gebruikers, een bescheiden aantal als je bedenkt dat het aantal mensen dat zich voor het congres had ingeschreven 2.000 was.

El aantal bekeken inhoud is van 354.

El grafiek 1 laat zien hoe, nadat toegang tot het Winnow-platform was geadverteerd, 150 unieke gebruikers het op de eerste dag gebruikten, met een totaal van 874 bezoeken in de eerste drie maanden.

Grafiek 1

Al grafiek 2 we kunnen zien hoe de gemiddelde tijd die gebruikers besteden aan het browsen op het platform ongeveer 4 minuten is. Met deze informatie kunnen we bevestigen dat het doel om de zoektijd in een video maximaal te optimaliseren en de inactieve tijd te verminderen, is bereikt, aangezien gebruikers rechtstreeks naar de video gaan waarin ze geïnteresseerd zijn en erin slagen om snel naar het punt te gaan dat de relevante informatie bevat .

Grafiek 2

El grafiek 3 toont het aantal gebruikers dat de zoekbalk van het platform heeft gebruikt.

Grafiek 3

De meest gezochte trefwoorden via de slimme zoekbalk zijn in de loop van de tijd veranderd. Tijdens de eerste 3 maanden van de pilot was het meest gezochte woord "kunstmatige intelligentie". Aan het einde van de pilot was het meest gezochte woord "data".

Conclusies

De verkregen statistieken tonen aan dat de toepassing van kunstmatige intelligentie op de multimedia-inhoud van een evenement het volgende mogelijk maakt:

  • Vergemakkelijk navigatie binnen de inhoud en voor gebruikers om snel te vinden wat ze zoeken
  • Automatiseer samenvattingen binnen audiovisuele content
  • Verzamel gebruikersgegevens om hun gedrag te analyseren en hun interesses te begrijpen

Het platform waar de content wordt gehost moet echter ook voor iedereen goed toegankelijk zijn, of het nu gaat om mensen die een bepaalde video nog een keer willen bekijken, of om mensen die niet bij het congres aanwezig konden zijn en geen "intelligente" bezichtiging willen.

In ons geval moest de toegang tot het Winnow-platform worden vastgelegd (op verzoek van Omnios, de startup van de ontwikkelaar) en we zijn van mening dat dit het gebruik van de service ontmoedigde omdat mensen wachtwoorden niet onthouden, nog minder als ze weten wat de inhoud is beschikbaar op Youtube, een gemakkelijk toegankelijke website die iedereen kent.

Een andere handicap die we tegenkwamen bij het extraheren van kennis uit de audiovisuele inhoud van het congres is de taal. De meerderheidstaal van het congres is het Catalaans, maar het Winnow-platform is nog bezig met het verbeteren van de algoritmen voor de interpretatie van natuurlijke taal van deze taal. We hebben kunnen verifiëren dat de woordenboeken en taxonomieën van het Engels en Spaans veel verder ontwikkeld zijn.

De ervaring van de pilot met de Winnow-service was daarom positief, maar het gebrek aan filmen in het Catalaans en het weinige gebruik dat van de service is gemaakt, heeft ons niet in staat gesteld voldoende gegevens van de gebruikers te verzamelen om een ​​uitgebreide analyse van hun gedrag te maken om hun behoeften en interesses te begrijpen en het inhoudelijke programma van het volgende Digital Government Congress 2023 opnieuw te kunnen ontwerpen.

Project status

Pilot voltooid

meer informatie