Idea 描述
timqian/chinese-independent-blogs
中文独立博客这个项目比较有意思,我想探索一下中文独立博客中的社交(友链)关系,挖掘一些有意思的信息,满足自己的偷窥欲 23333。
特性
一个可交互的站点,供用户探索中文独立博客的信息
- 爬虫和数据开源代码仓库
- 手工提交数据的入口
一份自动生成的报告
- 后续可以发展成
- 独立博客搜索引擎
- 按时间线排列的数据流
- 博客社交平台?
- 类似 hacknews 的论坛,发链接不发文章。大家讨论。
- RSS 推送?
- 独立社交网络?
- 草拟一种通用的规范,实现规范的博客,可以加入社交网络。
- 订阅关注博客的动态
前置任务
- [x] 爬虫设计
- [x] 数据可视化: 考察关系网络图轮子
蓝图