Soft_Job 板


LINE

前阵子参与 Women in Data Science 举办的线上分享会, 整理了当天的活动笔记与心得~ 有图好读 medium 连结: http://a0.pise.pw/RNR57 讲者介绍 - 杨晴(Steff) 现任 AI 新创 UNH3O 产品经理,带领产品 Engaged.AI 成长并负责从 0 到 1 的产品开发,为超过一万个亚洲品牌提供 Instagram 数据分析服务。曾在社群数据分析顾问公司 QSearch 担任 UX Engineer Lead,过去经历研究端、设计端、技术与开发端的历练,使她对於产品设计与开发的方法论与流程都有深刻的掌握。 正文开始 社群行销在现代的行销方法论中是很重要的一环,消费者对於品牌、服务、产品的接触点与转换行为都有机会透过社群媒体发生。UNH3O 的目标是分析社群媒体上的使用者足迹,并让品牌可以去驱动和影响消费者的消费行为,包含增加触及量、提升品牌认知、提升转化率等等。主力产品分别为 Engaged.AI 和 Emerged.AI。 Engaged.AI:B2B(Business-to-Business)、SaaS(Software-as-a-Service)产品,主攻 Instagram 数据分析,协助行销人员掌握行销成效。 Emerged.AI:B2B(Business-to-Business)、DaaS(Data-as-a-Service)产品,可以看作是 Engaged.AI 背後的数据引擎,不只告诉行销人员用户行为与轨迹等基於事实的描述性分析(descriptive analytics),更会透过机器学习的方法,从表面的结果挖掘背後的洞见,进而提供客户达成目标的建议(prescriptive analytics),用数据来驱动行销策略。 ▍什麽是 DaaS 产品? DaaS(Data-as-a-Service)数据即服务,是一种让客户透过数据本身来体验产品价值的服务形式。DaaS 产品建立在其数据可以按需(on demand)提供给客户,不受数据提供者和使用者之间的地域、组织差异而有所影响。 在设计与开发 DaaS 产品时要注意这三个元素: 1. 获取(Acquisition):如何取得资料? 2. 转化(Transformation):如何从资料中产生出有价值的资讯? 3. 璆I(Delivery):如何将数据交付与呈现给使用者? ▍数据获取(Data Acquisition) 对 DaaS 产品来说,能够持续拿到原物料才能有稳定的产出。常见的三种获取数据方法如下。 方法一、数据合作(Data Co-op、Data Coopereation) 和用户进行数据合作,由用户来提供数据给产品,而产品提供给用户数据分析的服务,随着用户数的累积可以获得愈来愈多的资料。例如 Clearbit、HubSpot。 方法二、商业合作(Business Development Deals) 透过与客户签署长期的业务合约来取得资料,在数据顾问公司中很常见。随着服务愈来愈多客户後,能够搜集愈来愈多的资料,增加数据资料库。 例如 Datalogix 透过跟不同车厂合作,帮他们做生产线、采购、交易上的数据整合,藉此得到大量车子类的资料後,进而推出数据服务的副产品。 方法三、公开资料(Public Data) 直接用爬虫的方式取得公开资料。例如一般的 Search Engine 也是用爬公开资料的方式来提供服务。 Emerge.AI 主要以数据合作、爬公开资料这两种方式来蒐集数据。数据合作的方式主要是从另一个产品 Engaged.AI 所服务的一万多个客户提供的资料来进行分析。 而公开资料的部分,以 IG 贴文为例可以得到以下资讯: - 基本资讯:帐户名称、地点、发布时间、赞数、文字内容、#hashtag - 视觉:图片 - 互动:留言内容、在贴文下面留言的用户图像(目标客群) ▍数据转化(Data Transformation) 单点的资料很难产生意义,但当把不同的数据结合在一起,就有机会创造综效并发现洞见。 举例来说,假设你身为迪士尼的资料科学家,获得「每天的入园访客人数」本身并不是一个有意义的数据,但若可以将访客数跟天气两者做比对,就有机会得到新的洞见。例如:下雨天的入园人数是否有改变?这代表什麽?我们可以针对这个发现提出什麽行动? 回到 IG 的案例,「互动率」高低本身没有意义,但若能比对出哪些要素出现的时候互动率高、成效好,这个资讯才会变得有意义。 一、从问题出发 从客户提出的需求出发,并透过多问「为什麽」来了解需求背後的细节与原因。 举例来说,客户提的需求是「我们想要在 IG 上找到拥有高消费力的帐户」来做更深度的品牌活动或 VIP 会员专案。这个需求与描述词汇非常模糊,也没有一定的标准可以参考,这时可以先反问客户「你们过去是怎麽判断和定义高消费力呢?」并做深入的访谈。 我们在访谈中发现,很多品牌客户都很擅长用「感觉」来回答问题——当你拿两个 IG 帐户给客户比较,他可以直觉判断出哪一个比较有钱;但当我们要客户明确描述做出这个判断背後的原因,他们有时候却答不出来。 跟着客户一起将问题往下挖後,我们以下这些数据点转化为高消费力标签(label): - 地点:很常出国、在很多不同的国家打卡 - 视觉:照片中很常出现名牌的 Logo - 视觉:照片视觉的呈现的很有质感、愿意花时间经营自己的形象 - 文字:文字内容出现高级品牌名称 基於以上的访谈与问题定义结果,接下来转化数据的流程大致如下:(1) 从问题出发、(2) 用户研究与假设、(3) 原型制作与假设。 (1) 即上述跟客户讨论「高消费力帐户」定义的过程、厘清客户需求。 (2) 用户研究与假设,则是根据研究结果建立不同的数据模型假设,在执行的过程中扣紧目标「判断这个用户是否属於高消费力」来提出许多不同的假设与实验结果,若有较适用的模型则会在下一步实际运用在真实资料上。 (3) 原型制作与假设,即将达成率最高的模型应用在实际的数据上。 【案例延伸】撷取自本场次 Q&A 的讨论 - 如何执行与验证准确率? 一开始用户使用的形容词是「贵妇」,「妇」可以归类为女性,但是「贵」呢?因此第一步是要透过与客户沟通将发散的名词定义清楚,经过一番讨论才得出「高消费力的女性」这个框架。接着,如同上述,去了解过去他们是怎麽用直觉去判断「高消费力」帐户。 我们将这个「客户的直觉」训练成一套 AI 模型,让电脑去 label 几百份资料、也让行销人员人工去 label 这些资料,比对看看我们是否真的有将这些行销人的直觉成功转换成 model 并确认是否能得到准确的预测结果,用人工智慧的方式去验证一些质化的内容。 从技术角度来说,很多时候我们会用非监督学习(unsupervised learning)的机器学习方式,亦即训练模型的过程中不会让人工介入,但因为模型与演算法的机制有时候很复杂,因此也只能针对跑出来的结果去判断好坏,再讨论需不需要换其他模型、演算法或持续调整。 二、让数据有意义 在前面定义问题的阶段,我们已经取得共识,要去观察打卡国家、视觉呈现、文字内容等 IG 贴文的资料,但是「常出国」这个资讯和单纯拥有「打卡地点」的原型资料是有落差的,所以会需要做一些前置作业(data preprocessing)将他们转换成可利用的形式。 举例来说,将打卡地点转换为国家的标签、将视觉上的 logo 撷取出来成为标签、将文字中的名牌名称转换为标签。 数据本身如果没有经过任何预处理,很难与其他数据结合、产生进阶的应用,所以我们会预先对数据进行处理,方便未来要解决用户问题的时候可以直接使用。 以 text -> entities 在文字内容中出现名牌为例,在 IG 上面的文字资料、文字量相对於过去的部落格文章是相对较少的,部落格文章通常一篇有近千个字,然而 IG 贴文可能只有 50 个字,我们要想办法从这 50 个字去理解这篇贴文的讨论主题与重点,包含是正面还是负面的讨论。 当我们直接去看整个贴文时很好理解,但当经过 tokenization(分词、标记化)的流程去处理资料,脉络与意义会在这个过程中流失掉,只看 tokens 的单字很难理解原意,只能透过关键字片面的理解部分内容。 为了解决这个问题,团队在做资讯撷取(information extraction)将文字转换为 tokens 的时候,还会再做第二层的处理,跟行销人员、客户共同制作辞典,将这些 tokens、labels 透过语意分割与标注(semantic labeling)转化为更有意义的资料,让用户来帮我们判断哪些资料是有意义、需要独立被分出来的。 ▍数据交付(Data Delivery) 常见交付数据给客户的的方法包含 APIs、Batch File、Integrations、Self-Serve UI、Dashboard 等。以 Emerge.AI 为例主要有三种方式,分别为可让客户独立操作的介面、跟 Engaged.AI 串接合作、以及产出客制化数据报告给特定客户,搭配顾问服务协助客户解释资料和挖掘洞见。 不论是哪一种数据交付形式都会面临到共同的议题 — — 如何透过优化与迭代让数据产品变得更好。 最难的是如何选定优化的目标,这部分我们也是从使用者出发,让用户来告诉我们!因此除了前期的用户研究外,我们也建立了一套让用户能主动给产品回馈的流程。 如果用户在系统中看到他们认为不正确的数据,就可以主动在产品内检举并提出原因给团队,团队收到後就会重新训练模型、重新执行,再看看新的资料是否有提供用户合理的数据、得到正面的回馈,透过这个与用户合作的正向循环来做更深入与更准确的 labeling。 这些训练过後的模型如果只是在实验室中测试,跟实际的情境通常都会有些差距,因此跟特定产业的使用情境接轨与持续互动,才能让资料真正的产生价值,让产品愈来愈好。 以上。 当天 12 场演讲的笔记精华,请参考:http://a0.pise.pw/PFUP4 -- 产品三眼怪实验室 \(OOO)/ https://medium.com/3pm-lab --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 126.196.4.246 (日本)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1586182213.A.A93.html
1F:推 yuanyu90221: 感谢分享 04/07 23:54
2F:推 Bonjwa: 酷 04/08 07:11







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:BabyMother站内搜寻

TOP