Презентация тут
Сделано на хакатоне GoTo Hack 2016
p.s. Если кому-то нужен исходный датасет, то можете писать любому из контрибьютеров.
Проект посвящен анализу особого социального слоя - пацанов.
Пацанов мы определили, как участников специфических групп в ВК - "пацанских цитатников". За более подробным описанием стоит обратиться к презентации. Почти все результаты там есть.
В какой-то степени были использованы следующие штуки:
- nltk
- vk-api для Python
- MongoDB и PyMongo
- Matplotlib
- Геокодер Яндекса
- Syncthing (для синхронизации больших бинарных файлов)