CloseAI提示您:看后求收藏(乡村小说网www.xcxs5200.com),接着再看更方便。
3年也没有一个理论上的答复,但很显然,巨大的模型还在持续地创造一个个奇迹。
不管是绘画,对话,还是图像操作,都还远没有到达极限。
“我非常希望自己能够清楚地从理论上告诉大家这个答案,但由于能力有限,我也只能给出自己的猜测,那就是Yes。”
“我相信,只要更多更好的GPU,更多更好的数据,以及更大大模型和更好的优化办法,我们就可以持续地创造奇迹。”
“而之前的网络在深度上遇到的阻碍,我认为并不是网络的能力问题,而是我们没有找到合适的办法去优化好它。”
让网络多重复几次,这是很多人都试过的事情,很显然,得到的结果是比原本要差的。
这在传统方法中,不是什么奇怪的现象,很多人都将这个现象解释为维度灾难或者过拟合,没有进行足够深度的探索。
“稍加思索,这显然是一个反直觉的现象,对于更深的网络,我们完全可以将小版本网络的所有参数复制进来,而多出来的部分只要什么事情都不做,这个模型就至少不会更差。”
“但事实上,却并非如此,我相信很多人都观察到了这样的普遍现象,那就是更深的模型反而变差了不少。”