8thFeb.2023 距离开学只有四天的时间了 今天接着把代码的问题解决一下,弄不清楚为什么所有的视频都会收敛到同一句话 看了一下一般的处理是要用mask把padding的单词都覆盖掉然后再用crossentrophy,还有embedding的部分也是,可能就是因为这个才导致有问题,还是没有搞清楚torch.reshape对梯度的传递到底会不会有影响 查了一下资料如果是用 torch.reshape(input,out 2023-02-08 daily #daily
7thFeb.2023 今天是周二今天是最后一个礼拜的星期二了,还有5天就要去学校了 在家里训练训练模型,复习复习要考试的东西,最后一个礼拜感觉过的也很快 2023-02-07 daily #daily
5thFeb.2023 今天是元宵节了!祝大家今天元宵节快乐哦! 今天上午去叶家堰玩玩,中午顺便去吃个饭 下午暂时没啥事估计会学习会吧。 晚上又要出去吃饭啦,希望今天可以早点回去 2023-02-05 daily #daily