是我太菜了,还是 pandans 就是这么慢

22次阅读

共计 279 个字符,预计需要花费 1 分钟才能阅读完成。

thinkpad T14 的机器,i7 的 cup,32G 内存。
我有两个 excel,一个 4 千行,6 列 名字叫 tb4k,一个 6 千行,10 列,名字叫 tb6k。
都用 pandas 接成 df 对象,然后循环两个 df。最后保存成 excel。

伪代码
遍历 tb4k 的每一行,取前三列的内容:
遍历 tb6k:
tb6k 的前三列一致:
将 tb6k 的后面第 5,8,10 行的内容赋值给 tb4k 的后三列
停止遍历 tb6k
保存 tb4k 到原 excel

我执行段代码。tb4k 遍历每一行大概需要 1s 左右 (包含 tb6k 的遍历)。导致我运行这段程序要接近 1 小时。
这速度也太慢了吧。还是我水平太菜了,没有用好 pandas?

正文完
 0