Friendster был одним из первых и широко

A rich source of U.S. data covering demographics, economy, geography, and more.
Post Reply
bitheerani319
Posts: 869
Joined: Mon Dec 23, 2024 3:33 am

Friendster был одним из первых и широко

Post by bitheerani319 »

используемых сайтов социальных сетей, где пользователи могли устанавливать и поддерживать многоуровневые связи с другими пользователями. Эта коллекция данных содержит графические файлы, позволяющие данные электронной почты исследования на основе данных и изучать взаимосвязи между отдельными страницами Friendster. Она также содержит набор данных, содержащий некоторые базовые метаданные об отдельных файлах в архивной коллекции.


Ранние наборы данных веб-языка (1996–1999)

Эти два связанных набора данных были созданы на основе глобальной коллекции веб-архива Архива Интернета. Первый набор данных, «Parallel Language Records of the Early Web (1996–1999)», содержит многоязычные записи, или URL-адреса веб-сайтов, содержащих один и тот же текст на нескольких языках. Такие многоязычные тексты с веб-сайтов являются ценным источником для корпусов параллельных языков и могут быть полезны для машинного перевода. Второй набор данных, «Language Annotations of the Early Web (1996–1999)», представляет собой ещё один набор метаданных, аннотирующий язык более четырёх миллионов веб-сайтов с помощью Compact Language Detector (CLD3).

Архивы Unleashed Cohort Program

В настоящее время принимаются заявки от исследовательских групп, заинтересованных в проведении вычислительного анализа данных веб-архивов. Для участия в программе с июля 2021 года по июнь 2022 года будут отобраны пять групп, каждая из которых будет состоять из пяти человек. Команды должны:

Примите участие в групповых мероприятиях, обучении и поддержке. Заключительное мероприятие состоится в Internet Archive в Сан-Франциско, Калифорния, США, ориентировочно в мае 2022 года. Предыдущие мероприятия будут проводиться в виртуальном формате или очно, в зависимости от ограничений, связанных с COVID-19.
Post Reply