第(1/3)页 随着进度条的推进,误差曲线开始平稳下降。 这意味着模型正在有效地收敛,并不是在瞎跑。 会议室里的人连呼吸都变得小心翼翼,生怕喘气的声音大了会打断这台机器的运算。 大卫咬着自己的大拇指指甲,眼睛一眨不眨。 约翰则双手按在桌子边缘,手背上的青筋因为用力过度而凸起。 但这几张废旧AMD显卡的算力实在太拉胯了。 加上ImageNet那一百多万张图片的庞大数据量,终端上的进度条挪动得令人发指。 李飞飞看了一眼时间,叫停了众人的死盯。 “进度太慢,今天跑不完的。大家先回各自工位,去忙手头的事情。” 老板发了话,众人只好散开。 但根本没人有心思做自己的科研项目。 回到工位后,实验室里出奇的安静。 没有人在敲论文,也没有人在调代码。 所有人的电脑屏幕上,清一色全挂着TenSOrFlOW的在线文档。 大家都在疯狂钻研这套全新的底层逻辑。 一号会议室成了全实验室关注的焦点。 每隔十几分钟,就会有人找借口溜达过去。 大家看完那个缓慢增加的百分比后,又满脸焦急地回到工位,带着抓心挠肝的期待感继续啃文档。 这种漫长又未知的等待,把整个实验室的人折磨得坐立难安。 跑训练的第一天晚上,陈冉干脆把睡袋搬到了会议室的地板上,时不时就爬起来看一眼屏幕。 整整两天两夜。 这台装满废旧显卡的测试机,发出长达四十八小时的算力轰鸣。 第三天傍晚,大家再也坐不住了。 整个实验室的人不约而同地放下了手头假装在干的活,全部涌入了一号会议室。 因为根据陈冉记录的耗时数据,最后一个批处理马上就要跑完了。 几十号人挤在会议室里,连大气都不敢喘。 当进度条终于跑到100%时,终端屏幕卡顿了一秒。 随后,一行最终的验证集评估结果跳了出来。 第(1/3)页