School of Data (Школа Данных) – 1

Сегодня (фактически вчера вечером, в 22 часа) я приняла участие в первой видеоконференции, проводимой в рамках онлайн-обучения “Экспедиция данных”, она же Data Expedition.

Итак, School of Data (http://schoolofdata.org/) где-то месяц назад анонсировала проведение так называемых “Экспедиций данных”, в ходе которых участники со всего мира, объединенные в команды, смогут поучаствовать в журналистике данных (добычи, обработке, анализу и составлению истории на основе данных).
Дело непростое, но хорошее и благодарное!
Это я почувствовала уже в первую нашу встречу.
Да, мы были объединены в группу по принципу географической близости. Это было сделано для того, чтобы нам было проще назначать совместные встречи.
На деле разброс по времени оказался в пределах 2-3 часов, и мы несколько дней не могли договориться о конкретном времени нашего рандеву.
Кстати, для этого мы использовали такой сервис как Doodle: http://doodle.com/
Но вот, ура, нам удалось все же договориться собраться хотя бы ограниченным составом.
Для этого мы должны были воспользоваться таким сервисом, как Google Hangout: http://www.google.com/+/learnmore/hangouts/
Организаторы “Экспедиции Данных” нам дали набор данных по выбросу углекислого газа в атмосферу: https://docs.google.com/spreadsheet/ccc?key=0AqwLVP6U7FhDdEZKa1pqa3VhbmkyWkF2Q2IxcnhtWHc#gid=1 (Источник данных: http://www.eia.gov/cfapps/ipdbproject/IEDIndex3.cfm)
А также ссылку на заметку в Guardian: http://www.guardian.co.uk/news/datablog/2011/jan/31/world-carbon-dioxide-emissions-country-data-co2#_

И вот, наконец-то, мы участвуем в видеоконференции.
Правда, предварительно нам пришлось слегка помучаться с организацией встречи, т.к. е-мейлы всех участников нам были неизвестны.
Рассылка шла по общему е-мейлу нашей группы.
И в начале мне услужливый гугл-переводчик даже предложил создать новый притон:
рп
Но через несколько минут мы все же победили свое замешательство и благополучно организовали общую видеоконференцию.
Коллеги предложили сравнить данные по выбросам углекислого газа в атмосферу с ВВП и уровнем развитости стран.
Я предложила для начала определиться с методами. Во-первых, надо данные перепроверить.
Для этого лучше всего сравнивать одинаковые данные, полученные от государства, с данными, полученными из международных организаций (ООН, ВБ, ОЭСР и т.д.).
Ведь данные, полученные из одного источника, могут оказаться недостоверными.
Сначала у нас почему-то разговор шел про Африку (Китти, вроде бы предложила). И другие участники поддержали Китти, что, мол, надо разделиться по странам и каждый будет изучать датасеты своей страны. А потом мы соберем их вместе.
А я предложила определиться со странами, которые могут предоставить нам датасеты одной области, но из разных информационных источников.
Например, попрактиковаться на датасетах Великобритании, США или Австралии. И затем уже приступать к анализу датасетов других стран.
Вроде бы мое предложение получило одобрение других участников.
Во-вторых, я предложила наложить данные по выбросам углекислого газа в атмосферу на данные из других областей и, таким образом, получить больше аналитической информации.

Итак, мы пообщались весьма конструктивно. Я попрактиковалась в английском. Под конец даже прочла что-то типа мини-лекции по каталогам открытых данных.
Внезапно для себя.
И мы расстались довольные друг другом.
Очень хорошо, что я не совместила эту первую видеоконференцию с походом на лекцию в Digital October, как планировала раньше.
Если подходить к делу серьезно, то лучше уделять “Экспедиции Данных” свое время и внимание.

Но сколько же радости принесла эта встреча!
Мне очень понравилось сотрудничать в онлайне с людьми, интересующимися открытыми данными, из других стран.

На будущее: надо будет заготовить несколько шаблонов по представлению работы с датасетами.
И ведь потом же придется рассказывать историю (storytelling), основанную на добытых и проанализированных данных!
Чертовски увлекательно!

Vía Ирина Радченко: http://iradche.livejournal.com/18282.html