La Biblioteca Pública de Boston tiene como objetivo aumentar el acceso a un gran archivo histórico usando AI: NPR

Las baterías de la Biblioteca Pública de Boston, uno de los sistemas de bibliotecas públicas más antiguas y más grandes del país.

Las baterías de la Biblioteca Pública de Boston, uno de los sistemas de bibliotecas públicas más antiguas y más grandes del país.

Aram Boghosian para la Biblioteca Pública de Boston

esconder

leyenda inclinada

Aram Boghosian para la Biblioteca Pública de Boston

Biblioteca Pública de BostonUno de los sistemas de bibliotecas públicas más antiguas y más grandes del país, está lanzando un proyecto este verano con la Facultad de Derecho de Openai y Harvard para que su trébol de los documentos gubernamentales históricamente importantes sea más accesible para el público.

Los documentos se remontan a principios de 1800 e incluyen historia oral, informes del Congreso y encuestas sobre diferentes industrias y comunidades.

“Es realmente un estándar increíble de material fuente primario que cubre toda la historia de los Estados Unidos, porque fue expresado por publicaciones gubernamentales”, dijo Capilla de JessicaJefe de servicios digitales y en línea de la Biblioteca Pública de Boston.

Actualmente, los miembros públicos que deseen acceder a estos documentos deben aparecer en persona. El proyecto mejorará los metadatos de cada documento y permitirá a los usuarios buscar y hacer referencia a textos completos de cualquier parte del mundo.

Chapel dijo que la Biblioteca Pública de Boston planeaba escanear 5,000 documentos para fin de año, y si todo va bien, desarrolle el proyecto a partir de ahí.

Que tengas un buen trato con AI

Debido al tamaño masivo y la fragilidad de esta colección histórica, lograr este objetivo es un proceso intimidante. Cada elemento debe ser ejecutado por un escáner a mano. Se tarda aproximadamente una hora en hacer de 300 a 400 páginas.

Un libro que se somete al proceso de digitalización en un escáner de la Biblioteca Pública de Boston.

Un libro que se somete al proceso de digitalización en un escáner de la Biblioteca Pública de Boston.

Biblioteca Pública de Boston


esconder

leyenda inclinada

Biblioteca Pública de Boston

La Universidad de Harvard dijo que podría ayudar. Investigadores de la Biblioteca de la Facultad de Derecho de Harvard Iniciativa de datos institucionales Trabaje con bibliotecas, museos y archivos en varios frentes, incluida la formación de nuevos modelos de IA para ayudar a las bibliotecas a mejorar la búsqueda de sus colecciones.

Las compañías de IA ayudan a financiar estos esfuerzos y, a cambio, pueden capacitar a sus grandes modelos de idiomas en materiales de alta calidad que no son derechos de autor y, por lo tanto, menos probabilidades de conducir al enjuiciamiento. (Microsoft y Openai se encuentran entre los muchos jugadores de la IA dirigidos por procedimientos recientes contra la violación de los derechos de autor, en el que los demandantes como los autores afirman que las empresas han robado sus obras sin autorización).

“Tener instituciones de información, como las bibliotecas involucradas en la construcción de un ecosistema de datos duradero para la IA, es esencial, ya que no solo mejora la cantidad de datos que tenemos, mejora la calidad de los datos y nuestra comprensión de lo que contiene”, dijo Burton Davis, vicepresidente del grupo de propiedad intelectual de Microsoft.

Acceso para todos

Greg Leppert, director ejecutivo de la Iniciativa de Datos Institucionales de la Biblioteca de la Escuela Lad de Harvard, dijo que no era el objetivo de la iniciativa otorgar acceso privilegiado a las empresas de IA a los ricos de información fuera de la información que se mantuvo en bibliotecas y archivos. Cualquiera puede tener acceso a los datos después del escaneo.

“Es una calle de doble intención, donde mejoramos los datos de una manera que ayudará a la IA, pero estas mejoras van a la biblioteca”, dijo Leppert. “Por lo tanto, también mejora la experiencia del propietario”.

Operai ayuda a la Biblioteca Pública de Boston a cubrir costos como la digitalización y la gestión de proyectos. La compañía tecnológica no tiene derechos exclusivos para los datos digitalizados.

“Nos beneficiamos, como otros, desde sus esfuerzos para digitalizar el dominio público, ampliando datos de alta calidad y conocimiento público sobre los que los sistemas de IA, incluido el nuestro, pueden confiar”, dijo la compañía en un comunicado de prensa en NPR.

Asociaciones público-privadas

Los profesionales de la biblioteca dicen que trabajar con compañías de IA proporcionará un acceso más amplio a la información.

“Creo que esta es una asociación realmente útil de la que vamos a obtener colecciones más accesibles”, dijo la Capilla de la Biblioteca Pública de Boston.

Y, debido a que los bibliotecarios están involucrados en la conservación y categorización de esta información, la integridad de los materiales utilizados por las compañías de IA puede protegerse más fácilmente.

“Tener profesionales capacitados con un profundo conocimiento sobre los sujetos es crucial en ese momento mientras comenzamos a desarrollar lo que traerá el futuro”, dijo el presidente de la Asociación Americana de Bibliotecas Sam Helmick.

Pero los expertos en la biblioteca también han expresado su precaución sobre estas asociaciones debido a las diferencias culturales entre las instituciones públicas y las empresas.

“El tipo de ética de” Silicon Valley “Move Fast and Break Things” es contrario a los valores de la biblioteca, que se refieren al acceso y la transparencia “, dijo Michael Hanegan, coautor del nuevo libro AI y bibliotecas generativas.

“Todo esto está cambiando tan rápido: la tecnología está jugando rápidamente. Las empresas se están moviendo rápidamente”, dijo Chapel. “Y las bibliotecas funcionan en una escala de tiempo muy diferente. Por lo tanto, hay una pequeña confrontación cultural”.

Jennifer Vanasco ha publicado esta historia para transmisión y digital.

Leave a Reply

Your email address will not be published. Required fields are marked *