网络信息系统实践02:确定你的数据源的分布

2020-01-08 14:06   

信息海洋中的庞大的网络,如何找到你想要的数据是一个大问题,而不是数据较好,但根据自己的需要,准确,方向找到数据源,以最大程度的确定所需数据提高工作效率。
在本文中,我自己真正的需求是钻,我要求:国内新的业务领域/业务相关的趋势的收集,了解行业火最近,感兴趣什么样的产品等。然后打破它可以如下改进:新公司的投资和融资的讨论,新闻报道,新产品的相关信息,一些行业相关的新闻,相关公司的社交网络,产品。在类型的划定一般的数据源的范围网站这样的故障,接下去我们需要做减法,屏蔽一些网站的目标数据源的代表,从这个范围内。
以上数据源段,我们定义的网络上的数据源的宽度和深度,而是来自于我们自己的需求“的经营发展趋势”的观点,这是一个不可量化的东西,所以我们要做减法,一般的做法被定义的关键字和相关联的数据范围(新数据已根据相关联的数据被计算出)的数量。例如,我们定义了三个关键部门,10名有代表性的公司及其产品,以及有限的10相关产业的发展,限制100家相关公司和他们的产品,因为联想是无限加深,我们可以定义一个2级或3级,更具体地,这部分操作的内容将在随后的制品中完成。
根据我们的要求细化,可以排序分布式数据源。可能如下:
首先,新公司的投资和融资情况
1. 36kr:公司报告,产品报告,投融资公司,投资和融资情况的列表
2. IT橙色:创业公司,投融资情况
其次,新闻
1.50新闻网站
2,百度新闻,360个新闻:提供搜索门户
第三,社交网络
1.新浪微博客:社会舆论
2.知乎:行业讨论
上方初步定义了目标网站,有什么捕获,建立协会的具体需求,将恢复工作,也可以作为一个项目的需求,数据源也可能是一个迭代更新,新发现在适当的处理数据可以被添加,并且还可以消除不适当的,这是通过设计管理模块后面的数据源来实现的。
要完成数据,以确定用户需求有效分配的来源是比较高的,需要更好地理解有关,这一步可以与一些业内专业人士集思广益的方式进行组合需求的网站。
接下来,我们分析拆解和数据层面这需要确定工作。
英雄联盟| CF穿越火线| 绝地求生| 和平精英| DOTA2| 炉石传说| CS:GO|