Самая большая библиотека мира соберет все записи с Twitter

Библиотека Конгресса объявила, что она завершила процесс сбора необходимых данных. Надлежащий сбор будут храниться более 170 триллионов государственных твиты. Все началось в 2010 году, когда он был создан договор между государственным учреждением и Twitter.

Таким образом, платформа микроблогов была построена, чтобы поставить Библиотеку Конгресса в соответствующих данных, начиная с 21 триллионов сообщений, созданных в период с 2006 по 2010 год, в остальных 150 триллионов твиты. Библиотека говорится в заявлении на статус проекта объявил, что Twitter будет принадлежать к новому типу коллекции. Общество все больше внимания своей деятельности вокруг крупных социальных сетей и использует их, чтобы общаться и выражать свои чувства.

Таким образом, создание новой коллекции, которая будет включать в себя архив таких записей, конечно, только те, общественность. Несмотря на то, Библиотека Конгресса только в процессе создания такого отдела, и все же она не давала ему доступ к посторонним, и поэтому он уже собрал ок. 400 запросов от исследователей и ученых со всего мира. Несомненно, это становится источником интересной научной работы.

Тем не менее, мы не знаем точно, как собранные данные будут израсходованы, но выпустили библиотеку документов, где вы можете найти информацию о всем проекте. Вы задаетесь вопросом, сколько может весить такие большие базы твитов? Библиотека объявила о том, что две копии всей базы данных, содержащей 170 триллионов сообщений включает ок. 133 терабайт данных. Другими словами, это ок. 136,192 гигабайта.

Данные будут служить и современные исследования и будущее. Комментируя заявление, что их использование будет в состоянии сделать такие вещи, как и анализ настроения сопровождающих важные события, такие как. Президентские выборы или любое бедствие. А какое мнение у вас есть по этому поводу?