作者ms0344303 (我不玩了)
看板R_Language
标题[问题] 以性别比预测或观察点餐内容
时间Tue May 30 18:34:08 2017
[问题类型]:程式谘询
意见调查(我对R 有个很棒的想法,想问问大家的意见)
程式谘询(我想用R 做某件事情,但是我不知道要怎麽用R 写出来)
效能谘询(我想让R 跑更快)
经验谘询(我想用R 连接某些资料库,请问大家的经验)
[软体熟悉度]:入门
请把以下不需要的部份删除
新手(没写过程式,R 是我的第一次)
入门(写过其他程式,只是对语法不熟悉)
使用者(已经有用R 做过不少作品)
开发者(有撰写R 的套件经验)
[问题叙述]:
http://i.imgur.com/0KNI5Cx.jpg
如这张照片所圈示 这是一份KTV点餐纪录
本来有些餐点价格是开箱低消0元优惠的删除了
一份单子会有很多不同食物 这资料是以食物种类建档 每种食物就是一笔
不同的人去消费原则上是以BILLCODE去做区分
我本来是想分析性别比(男生/总人数)的差异对於点餐组成有没有影响
後来发现性别比居然也有290几种数值
不能以简单长条图或圆饼图了
想问大家有没有好用的套件或一些做法可以达到我的目的
请简略描述你所要做的事情,或是这个程式的目的
[程式范例]:
library(dplyr)
library(tidyr)
library(ggplot2)
library(data.table)
#读党 建立性别比
ticketdata1 <- fread( "customerBehavior3.csv", stringsAsFactors = FALSE,
header = TRUE, sep = ",",encoding="UTF-8" )
ticketdata1$Genderratio <- ticketdata1$MaleNumber / ticketdata1$CustomerNumber
#删除优惠0元点单(子集合)
MealSpending.sub <- subset(ticketdata1,MealSpending > 0, select =
StoreCode:Genderratio )
unique(MealSpending.sub$Genderratio)
grouped <- group_by(MealSpending.sub, Genderratio , MealType)
#啤酒类出现最多次
table(grouped$MealType)
目前是这样而已 因为下一步不确定怎麽分析比较有效率
张贴能够重现错误的程式码,可以帮助版友更快的帮你解决问题
建立重现错误的方法可以参考:
程式码可贴於以下网站:
http://ideone.com/
http://codepad.org
http://pastie.org/
http://nopaste.info/
http://pastebin.com/
http://paste.plurk.com
http://gist.github.com/
http://nopaste.csie.org/
[环境叙述]:
请提供 sessionInfo() 的输出结果,
里面含有所有你使用的作业系统、R 的版本和套件版本资讯,
让版友更容易找出错误
[关键字]:
选择性,也许未来有用
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.249.16.128
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/R_Language/M.1496140451.A.600.html
1F:→ hohiyan: 你可能需要先把你的研究/分析问题弄清楚一点 05/30 22:09
2F:→ hohiyan: 软体只是工具,你丢什麽进去它就吐什麽给你 05/30 22:10
3F:→ hohiyan: 如『对於点餐组成有没有影响』是指什麽样的影响? 05/30 22:11
4F:→ hohiyan: 数量上的影响?种类上的影响?点餐时段上的影响? 05/30 22:11
5F:→ ms0344303: 这边组成是指种类上的影响 05/30 22:33
6F:推 cd12631: 你可以尝试先把性别比>0.5的抓出来 05/30 22:38
7F:→ cd12631: 因为性别比>0.5 等於该组客人中男性占多数 05/30 22:39
8F:→ cd12631: 然後把性别比>0.5的资料全部置换成同一种输入 05/30 22:40
9F:→ cd12631: 去看看在男性多的时候 每种食物出现的笔数 05/30 22:41
10F:→ cd12631: 就可以去作一个长条图显示在男性为多的客人中 食物销量 05/30 22:41
11F:→ cd12631: 反之要看女生为多就抓<0.5 05/30 22:42
12F:→ cd12631: 更进阶一点可以去做一些连结分析的模型 05/30 22:43