и благотворительных организаций, таких как Фонд Найтов, Архив начал преобразовывать поток данных о субтитрах, необходимый всем американским вещательным компаниям, в поисковый индекс. «Этот простой подход преобразил устаревший подход к поиску данные электронной почты тем в видео», — сказал Макдональд, один из руководителей проекта. «Поиск по телевизионным субтитрам позволил находить информацию со скоростью интернета, одновременно просматривая миллионы программ и отображая результаты в динамике, вплоть до отдельных вещательных компаний и программ».
«[Телевидение] — невероятно влиятельное и важное средство информации, убедительное, но при этом не то, что можно цитировать. Мы хотели сделать его таким, чтобы можно было цитировать, сравнивать и сопоставлять».
Брюстер Кейл, Интернет-архив
Учёные и журналисты быстро воспользовались этой возможностью, но команда продолжала экспериментировать с более глубокой индексацией. По словам Макдональда, такие методы, как аудио-отпечатки, оптическое распознавание символов (OCR) и компьютерное зрение, позволили фиксировать визуальные элементы новостей и улучшить доступ к ним.
Были созданы подколлекции речей и интервью политических лидеров, включая обширный архив Дональда Трампа . По словам Макдональда, некоторые из наиболее плодотворных достижений Архива стали результатом сотрудничества с внешними пользователями, которые запросили более широкий доступ к коллекции, чем тот, который доступен через общедоступный интерфейс. С учетом соответствующих ограничений, необходимых для соблюдения требований вещательных компаний и платформ распространения, Архив сотрудничал с отдельными учеными и журналистами в качестве партнеров, чтобы использовать данные из коллекции для более сложного анализа.
vcfxz`благодаря пожертвованиям частных лиц
-
- Posts: 869
- Joined: Mon Dec 23, 2024 3:33 am