作者rockchangnew (rock)
看板Database
标题Re: [讨论] 关於结构性资料的问题
时间Sat Jun 7 11:13:08 2014
※ 引述《APE36 (PT乡民)》之铭言:
: 请问大家认为在巨量资料(big data)资料库的定义中,
: 何谓是结构化性的资料(structured data)?
: 何谓非结构化资料(unstructured data)?
: 关於这两点假如要提出来做说明,感觉好像都找不到相关的说明例子
: 不知道有人对这定义性的问题熟悉吗??
: 可否分享相关资讯给小弟!!THX
就小弟粗略的观点来解释,如有错误请海涵
目前我们DB绝大多数的设计都是所谓的关联式资料库
会用所谓的正规化来设计资料表避免资料重复等问题
所以我们在取资料时常会需要Join许多资料表才能完成
而目前很热门的big data,其资料来源是四面八方且都没
经过整理,比如说你的公司在facebook开了一个粉丝团
你想了解并分析粉丝们对公司产品的喜好,因此跟facebook
购买资料,但这一些资料并没经过整理,也许很像文字档的LOG
,如何分析这样大量且非正规化的资料,这就是big data的
卖点了
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 140.136.224.65
※ 文章网址: http://webptt.com/cn.aspx?n=bbs/Database/M.1402110791.A.2DF.html