Trascrizione di testi

Definizione:

La trascrizione di testi si riferisce al processo di conversione di testi scritti a mano o stampati da documenti, immagini o video digitali in testo elettronico.

Utilizzo:

Convertire il testo in formato elettronico consente di rielaborarlo con strumenti informatici, ad esempio per copiare e incollare, modificarlo in vista di una pubblicazione o analizzarlo al computer. 

Note : 

  • Qualità: le trascrizioni automatiche contengono sistematicamente degli errori, in particolare nei documenti antichi o scritti a mano.
  • Riservatezza: per i servizi online, è necessario tenere presente che i documenti vengono trattati da società commerciali e prestare quindi attenzione alle informazioni condivise con questi fornitori esterni in materia di protezione dei dati personali.
  • Contenuti: la trascrizione del testo non esaurisce il contenuto informativo di un documento. Possono essere prese in considerazione anche le informazioni relative all'impaginazione, alla struttura del testo o ai caratteri tipografici.

Selezione di strumenti per un pubblico generico

  • Google & Microsoft
    Google offre strumenti gratuiti per convertire documenti PDF in testo elettronico (Google Docs) ed estrarre testo da singole immagini (Google Images). Google offre anche un servizio online a pagamento specifico per la trascrizione di documenti (Google Document AI), all'interno di una gamma più ampia dedicata alla visione artificiale (Google Vision AI). Servizi simili sono offerti da Microsoft (Microsoft Azure Cognitive).
  • Transkribus
    Uno dei migliori strumenti di trascrizione per scritti manoscritti in termini di qualità, funzionalità e facilità d'uso. Servizio online a pagamento. Nato da progetti di ricerca accademica finanziati dall'Unione Europea.
  • ABBY Fine Reader
    Servizio online a pagamento per la trascrizione di documenti stampati in numerose lingue e caratteri moderni, nonché diversi tipi di documenti. Sviluppato da uno dei principali operatori storici nel campo del riconoscimento automatico della scrittura e della struttura dei documenti.
  • Adobe Acrobat Pro
    Soluzione a pagamento per arricchire i documenti PDF con testo elettronico, in modo da poter cercare o copiare/incollare il testo dal loro contenuto.

Selezione di strumenti che richiedono competenze informatiche avanzate

  • Kraken & eScriptorium
    Codice sorgente gratuito per la trascrizione di scrittura manoscritta e stampata, in particolare non latina e premoderna. Sviluppato dall'École pratique des Hautes Études, Parigi.
  • Tesseract & OCRopus
    Codici sorgente gratuiti per la trascrizione della scrittura stampata. Si tratta di strumenti open source storici per il riconoscimento della scrittura, sviluppati da Hewlett-Packard, Google e dal Centro di ricerca tedesco sull'intelligenza artificiale di Kaiserslautern.

Per approfondire