Question

我正在使用以下格式的表：

我想用以下方法来绕开它：

<script src="https://cdn.jsdelivr.net/npm/@tensorflow/tfjs@1.0.0/dist/tf.min.js"></script>

问题是原始df中有80k条记录。 Google Colab和我的计算机都快用完了。有没有有效的方法来达到相同的结果？

编辑：我正在使用Cell_Phones_&_Accessories.txt.gz的数据。我无法计时，总是崩溃。

Answer 1

对我来说，现在有两个选择：

user_product_rating = df.groupby(['review/userID'])['product/productID'].mean()