作者pl132 (pl132)
看板Python
标题[问题]有办法解决index太多无法存入pdframe吗?
时间Fri May 13 18:30:40 2022
各位版上大大好
小弟最近在学习大数据分类
有个资料集我在使用Groudby分类之後出现双重索引,在我使用pivot function把两个索引
一个变index一个变column的时候会跳错
由於小弟才疏学浅,一直找不到解法,不知道各位大大有遇过这样的经验吗?
下面是错误讯息:
RuntimeWarning: overflow encountered in long_scalars num_cells = num_rows *
num_columns Exception "unhandled IndexError" index 1579266012 is out of
bounds for axis 0 with size 1579249988
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 180.177.1.144 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1652437842.A.CED.html
1F:推 lycantrope: 别pivot, 资料重复会缺损都会error 05/13 19:01
但是我用以下方式也是跳错
two_level_index_series = df.set_index(["姓名", "科目"])["分数"]
都会跳出索引不够....series的时候就不会跳错= =
※ 编辑: pl132 (180.177.1.144 台湾), 05/13/2022 19:04:30
※ 编辑: pl132 (180.177.1.144 台湾), 05/13/2022 19:05:03
2F:推 lycantrope: 都可以完整读取dataframe怎麽会索引不够. 05/13 19:10
※ 编辑: pl132 (180.177.1.144 台湾), 05/13/2022 19:57:16
#df3.pivot(index='User-ID', columns='ISBN', values='Book-Rating')
我是下了这行要再转到新的pdframe就跳错
※ 编辑: pl132 (180.177.1.144 台湾), 05/13/2022 19:57:51
3F:→ polom: 先downcast一下 05/13 23:25
4F:推 lycantrope: 问A答B,这麽执着用pivot...也只能祝福了 05/14 00:26
我只是说那两个方法都会类似错误啦= =我倒没有一定要用pivot
※ 编辑: pl132 (180.177.1.144 台湾), 05/14/2022 16:59:56