作者stayfool (fool)
看板Python
标题[问题]tenflow dataset 元素顺序求解
时间Wed Jan 20 17:48:22 2021
程式码
builder = tfds.builder("wmt", config=config)
datasets = builder.as_dataset(split='train')
for value in datasets:
print(value)
程式执行结果,每次都不一样,dataset里的内容依序是你、我、他
预期执行结果如下
你
我
他
但实际执行结果却是随机,有时你、他、我,有时我、你、他
改成
for value in datasets.range(3):
print(value)
执行结果只能得到数字012,顺序正确但需要的是"文字"
请教如何改写才能得到正确的结果
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.171.144.10 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Python/M.1611136104.A.DF5.html
1F:推 Ryspon: 跟新版 tf 不太熟,把 datasets 转成 orderedDict 试试? 01/20 23:53
2F:→ chickengod: config=config 这行的问题?是不是有shuffle? 01/21 04:58
3F:→ chickengod: print(list(datasets.as_numpy_iterator())[:3])) 01/21 05:23