《重生之AI教父》 第1章 我会给他一个无法拒绝的价格 2013年的12月,孟繁岐即将前往澳大利亚,西尼,参加计算机视觉方向的顶级会议,iv-2013,国际计算机视觉大会。 他没有任何的文章投稿并发布在这个会议,但所有人都很清楚,这个没有投稿的人才是本次会议的绝对核心。 去年的同一时刻,ai三巨头之一,加拿大多伦多大学的辛顿(hton)与自己的学生阿里克斯(alex)一同发布了alex。在千万级别的图片上提取了人类难以理解和解释的知识。 作为唯一一个使用神经网络作为核心算法的队伍,他们以碾压的姿态击败了传统的算法,获得了千分类这样一个复杂视觉任务的冠军。 ai的新时代,深度学习从这一刻开始,以谷歌,微软,白度等公司为首的巨无霸科技企业蜂拥而至,让原本比较纯粹的ai领域多了几分工业界的务实,当然也有一些资本的铜臭。 2013年,相同的赛事例行举办。就在各路高校,机构还在争相复现去年辛顿团队的结果之时,一个众人从未听过的名字,孟繁岐,使用drea,以一个更为夸张的性能提升傲立于竞赛的所有任务榜单之上。 并且48的-5错误率更是已经突破了赛方四年前提供的人类标准51。 这个恐怖的提升完全超乎了所有人的想象和理解。 此时距离结果的公布已经接近一个月,整个学界对这个结果是如何做到的仍旧是一无所知。 协办该赛事的国际计算机视觉大会会议方早已给名列前茅的参赛者们都发送了邀请邮件。 所幸这个神秘的“ng”很快便确认出席。否则还真没有人清楚到底该怎么联系上他。 不仅是不够熟悉这个领域的人难以想象,就连深耕该领域接近半个世纪,去年以三人之力刷爆榜单的辛顿团队,也完全想不明白这么恐怖的性能进步到底是怎么实现的。 有人在自己最擅长的领域做出了这么可怕的突破,自己却完全没有任何思路和头绪,这对这个灰白头发的老人来说是一件一时间不大容易接受的事情。 除此之外,最大的压力来自于他的雇主谷歌。 时年六十五岁的辛顿在去年将该竞赛的千分类-5准确率从75左右直接提升到单模型85。这对当时的谷歌来说是一个巨大的震撼。 虽然没有正式参赛,但一向对海量数据的处理非常自信的谷歌,私下里在竞赛的数据上做了一些验证。结果却发现,拥有丰富大数据处理经验,并具备海量计算资源的自己,被辛顿三人组这样一个学界的小团队给狠狠地爆出了十条街。 技术是核心生产力。 敏锐地谷歌很快意识到深度神经网络的潜力,但同时的,还有其他知名公司和机构。辛顿团队的电话和邮箱很快被挤爆, 谷歌派出了工程主管阿兰(an),甚至名震硅谷的杰夫(jeff dean)亲自前往加拿大拜访,以求辛顿团队加入谷歌。 杰夫其人加入谷歌甚早,也是早期谷歌三位大牛之一,由于其实在太牛,坊间流传有不少他的笑话,人称姐夫笑话。 大抵都是些,“光曾经时速只有120k\/h,后来杰夫花了一个周末对物理学进行了小小的优化” 又或者,“杰夫编程的时候只使用0和1两个按钮” “编译器从来不给jeff警告,是jeff警告编译器” 他在2011年创立谷歌大脑,誓要奠定谷歌ai世界领先的地位。并且在12年,就已经能够做到识别自己旗下youtube视频内的一些内容,以及大大增强了语音识别的准确度。 杰夫坚信,没有人比他更清楚这背后的价值,而他会给辛顿一个他无法拒绝的价格” 事实上也的确如此,当竞标的价格超过2000w美金之后,辛顿三人就已经开始失去数字上的概念了。这种感觉非常不真实,虚无而缥缈。 直到谷歌和白度的相互竞价来到4400w美金之后,辛顿中止了继续竞价的流程,选择加入谷歌。 而实际上杰夫的愿意付出的金额还远远不止于此。 时隔一年,杰夫和辛顿再一次站在了谈判桌前,只是这一次,他们两个属于同一方阵营。 他们的想法也如出一辙,“谷歌必须要得到他,我们要给他一个无法拒绝的价格。” 只不过等真的迈入西尼的那间会议室的时候,两个人对视了一眼,想法却同时产生了一些动摇。 面前这个华国的年轻人似乎年纪也太轻了一些,在这个至少也是硕博生参与的领域中,一个二十左右的大三学生显得不是那么值得信任。 “你是一个很爽快的人,也是一个很聪明的人。我们就不绕什么弯子了。”杰夫单刀直入道,“大部分时候,我相信年轻意味着无比的潜力。但从你的经历和教育背景来看,我也不得不为公司考虑,你这次的成就只是幸运和碰巧的可能性。” “这是一笔天文数字的合同,我们只是在谈论一些可能性,希望你不要有其他的想法。”辛顿补充道。 孟繁岐对这件事情早有预料,深度学习,深度神经网络性能崛起之前,辛顿已经成为了该领域的鼻祖,谷歌敢于直接斥资四千万+美金,是出于有基础的信任。 自己没有历史成绩,年纪这么小,甚至专业也并非相关专业,谷歌有此担忧也是理所应当。 “不如这样如何,我们可以签下对赌合约。”信任不够的情况下,对赌合约是最好的解决办法,对自己不希望发生的情况施以惩罚避免损失,对自己希望发生的情况则多让渡一些利益。 “我们可以按照研究成果的质量和数量签订价格,或者按这些成果的采用情况乃至将来带来的额外收益进行分成。如果我的方法不被谷歌采用,或者采用后没有带来收益,我甚至可以不拿一分钱。” 杰夫和辛顿面面相觑,别的不说,面前的这个年轻人对自己的信心和胆魄实在是首屈一指。 甘愿放弃自己两人提出的1000w美金三年的天价合约,去以低底薪按成果对赌奖励和分成。 他就对自己的智慧那么有把握?能够总是取得如此惊人结果? 两位巨头带着疑惑和眼前的这个年轻人签下了合约。 后来面对媒体采访时,杰夫经常感叹,这么一签,就被这小子给薅麻了,我的心真的很痛。 “但孟在谷歌时期奠定了那么多领域的核心和基础算法,您难道不高兴吗?” “痛,但痛并快乐着。” 第2章 十年一梦2013 “孟繁岐!你来说说,老师刚刚讲了什么?嗯?” 华国,燕京电力大学。讲台上一个短发干练的中年女教授声音微微拔高,周围同学们脸上纷纷露出幸灾乐祸的喜悦表情。 “哈哈,又有人要倒霉了。” 台下阶梯教室中,趴在桌上的孟繁岐猛地起身,整个人不由自主地一抖,眼神失焦。 只觉得浑身冷汗,口干舌燥。 回过神来之后,他不需要看周边一个个熟悉的同学面孔,只看黑板上那三相电机的正反转原理图,就知道自己回到了什么时候。这是13年的时候,自己十年前大二的专业课内容。 自打离开了大学校园,他这辈子再也没接触过自己的本科专业知识。 他微微喘着粗气,有些不可置信地看着自己的双手。“我我怎么从2023年回到了十年前?” “呦,这小气喘得,给你睡累了是?” 现在不少大学生上课不认真听讲,彭老师虽然担忧,但却也无可奈何,时间久了便见怪不怪了。“你们啊,就是被高中老师骗惨喽,觉得高考结束了,人生就不用再努力了。可你们不努力,以后谁来替你们的人生负责呢?” 孟繁岐样貌还算英俊,为人又开朗外向,大一的时候曾经和学院一位老师一起做过一些学院活动的主持工作。 因而彭老师对他印象还算不错。对于电气工程及其自动化这个专业来说,自己刚刚提到的三相异步电机是交流供电的重要电机。 是专业内的重要知识,基础知识,核心知识。这部分知识都不弄明白,以后电机实验课,后续的进阶课程比如继电保护那还怎么学? “大学的专业课知识才是最重要的,没有一门专业技术,没有学科的专业知识,以后到社会上怎么就业,怎么参加工作?去跟别人说自己的高考成绩吗?” 见孟繁岐支支吾吾,哑口无言,彭老师深深叹了一口气,也没有继续为难他。自顾自地往下讲了下去。 讲台下的大学生们大都听不进去这句肺腑之言,大家都觉得高中这么累,读了这么久了,大学到了新的地方,还不得起飞了? 学习?学个屁! 往往都是开局先玩一两年,等到大三大四的时候才回过味来。 再迟钝一点的,得要到大四毕业等于失业了,才明白过来自己得做点什么。 “我这从十年后回来,还不如当时对电气懂得多呢。”孟繁岐仔细又看了两眼黑板上的电机原理,发现一点也看不明白,两眼一黑,不由得自嘲。 他前世大一到大三吊儿郎当,学业不精,直到快大四了才正视一个现实问题:那就是自己对这个专业一点兴趣都没有。 “电气这行业有什么干头?难不成我以后真去爬电线杆子?”孟繁岐的室友唐璜同样对这个专业毫不感冒。 孟繁岐看着毫不在意,正在专心上课玩手游的唐璜,微微笑了笑。 前世的唐璜也算是说到做到了,转专业不成,大三便干脆不读了。他家中倒也富裕,便索性出了国读通信。 在国外读的时候由于通信和计算机类其他专业选课混杂在一起,唐璜又对模式识别燃起了兴趣,一番思索之后,把专业转向了ai图像相关的方向。 换了专业读硕,毕业回国后正巧又赶上18年左右ai起飞的当口,成了风口上的猪,截到2023年的时候税前收入已经逼近百万。 真要论起来,孟繁岐改方向去学ai,九成是被这小子给影响的。14年他醒悟过来工作和现实的问题,早早准备考研,倒也有个好去处。只是后来终究还是觉得不喜爱这个专业,不想从事这方面的工作。 那段时间他与唐璜聊了良多。思前想后觉得做一个程序员不用东奔西走,倒也是个不错的出路。尤其ai相关的多个产业智能化自动化既有趣味,未来又有前景,而后两人便一起读了不少论文,跑了些代码,把简历包装得像是那么回事。 17-18年这方向不像23年就业的时候那么卷,讲究计算机纯血出生,讲究什么985,211,qs前一百,加上电气电子又都是临近专业,倒也没人在意他原本的专业学的是什么。 “不喜爱自己的专业,不了解自己的专业倒也正常。我们高中的时候受到的所有教育都是,要专注于学习,补习,刷题,取得高分考入知名大学。”孟繁岐还在十年一梦的恍惚当中。 他工作的那些年没少因为缺少足够的计算机科学基础知识吃亏,别人早就熟知的东西他要恶补。 “专业选择,人生规划,职业路线,其实和高考相同重要。只可惜我们当初远远缺乏足够的思考和投入。”唐璜玩手游的动作停滞了一下,似乎感觉到自己的室友今天怪怪的。 但这件事其实也是他一直担忧的,“我还是觉得专业前几才能换专业这个规矩太离谱了。兄弟我就是学不进去这个专业,学不会这个专业才想换专业。结果想换专业还得考前几名?要真能学这么好,兄弟还换个屁咧。” 习惯了职场生活的孟繁岐,如今猛地听到室友熟悉的吐槽,不知为何竟觉得有些感动。但感动归感动,嘴上自然还是不能饶人。“你小子一学期分给学习的时间加起来就考前三天,能学好才是有鬼了。” 说起来,孟繁岐刚入学的时候,一宿舍六个人,大家相互寒暄,论年龄分了大小。闲聊的时候愣是没有一个说得出自己为什么要选这个专业的。 “大家都是为什么读了这个专业?”这个问题一出,几人皆是心照不宣地哈哈大笑。 只是大一初见的时候自然是笑得开心,等到工作几年再回想,事情就显得有些愚蠢了。 “说白了还是鸡娃去高考容易呗。”唐璜倒也没多想,继续顺着话头吐槽道,“让孩子好好学习多轻松,人人都能做到。可真要深思熟虑,考虑家庭情况,社会发展等诸多因素,挑选个好的专业,那可就难喽。” “人家父母也有理由说的,别的父母带的是什么孩子?都是考京华大学燕京大学的。你这什么水平?他唐璜什么的都在想着随便挑专业,他能挑吗?没这个能力知道。”一旁的球迷刘旭见唐璜整天不思进取,还想着换专业,便马上借如今正火的足球范之毅大将军段子嘲笑他。 “再这样下去要挂电机了,挂完高数挂电机,再挂电路,接下来没课挂了。脸都不要了。” “哈哈,这个哏玩到现在还没腻啊?真有你的。”唐璜丝毫不以为意,他平时最爱嘴毒,自己自然是身经百战,练就了一副厚脸皮。“别吹了,今晚lol还是dota2?搞起了呀。” 孟繁岐听到这话又是一阵怀念。大一的时候宿舍里就属他们三个网去得多,唐璜中学是玩dota2的,自己和刘旭玩lol。三兄弟关系这么好,到了网总不能分道扬镳,各玩各的。 彼此之间经常迁就一下,一起战斗,俗称双修。 “今天玩dota2。”孟繁岐想起2018年ai和冠军队伍og的那一场大战,便选择了dota2,说起来,前世自从唐璜出国之后,自己就基本上再也没碰过这个游戏了。 下课后,走在前往食堂的路上,孟繁岐把手臂往唐璜的肩膀上一搭,有些意味深长地说道,“你说有没有可能有一天,我们三兄弟组个队把dota2的ti冠军给赢了?” 唐璜对天发誓,他真的没有想到孟繁岐这时候是认真的,并且不到四年的时间就成真了。 话又说回来了,即便他知道这是四年后的事情,他也绝对想不到是用这种方式取得胜利。 第3章 简单的第一桶金 重生人士到底该怎么赚钱,这是个好问题。 大家都做过这样的美梦,但很少有人真的做过这样的准备。 你会去背上次上亿奖池的彩票中奖号码吗?以备不时之需? 又或者说,你确定真的是号码中奖吗? 孟繁岐没有系统傍身,也没有获赠超级记忆,家中也无大量财力。 若是好友刘旭来重生,他大抵能基本记住世界杯,欧冠,nba之类大型比赛的所有重要胜负,甚至比分。 不过这东西买得大了,倒也不好说能不能真的安稳到手。 要买房产吗?先不说自己家里掏不出那么多钱在大城市黄金地段置办两套,房产才赚几个钱。翻到三四倍顶了天。 要说普通人2013年买什么东西利润最高,还得是某虚拟的货币。 只不过这东西跟着喝点汤,嘎嘎韭菜,慢慢出个千把万到手躺平倒还够用,若想真的靠它几个亿几个亿的赚,那就真把那群资本家当傻子了。 来到网,孟繁岐先腾出手查了查btc的价格。15美金一枚。 “时间有点晚了。”孟繁岐暗暗叹了一口气,这要是再早三年,btc只要006美金一枚。翻到今天就是250倍。 不过2013年秋冬的时候,btc有一波小涨,八九月份的时候就已经涨到了130多,年底甚至突破了千刀的高价。 一本万利,只需几个月,就能翻出接近一百倍的金额来。 孟繁岐看着自己可怜巴巴的一万元全部财产,投了8000多进去,买了88枚btc,非常吉利。 待到秋冬,这就是大几十万的初始资金。 等赚完这一轮之后,倒也不用急着继续再买再屯了。 这东西正式起飞大概是17年左右,13年底虽然涨到过1000刀的高价,但之后则是长达四年的起起伏伏,一直没能再破千。 在15年的时候,还回到过200刀出头的价位。 等到15年中旬的时候再记得以220左右的价格购入就好了。在手里拿到21年卖掉,大概是多少来着,差不多刀?这就是差不多260倍左右。 现在先翻第一桶金,等到15年的时候再买一些作为自己财产投资和保值的一小部分。作为信息时代的重生人士,第一桶金实在是再简单不过的事情了。 唯一需要的便只是一点小小的耐心。 不过重走这十年,财富自由也只是一个小目标罢了。如果只想着靠几个btc过活,吃大资本手指缝里漏出来的一点带肉骨头,未免有些太没出息。 如何尽快克服困难,把前世自己记得的技术往前赶个半年一年提出,尽量多吃多占,这才是最要紧的事情。 平心而论,自己实在再幸运不过了。作为ai算法工程师,孟繁岐很清楚自己记忆中的很多算法和技术将会为自己取得多么夸张的地位和财富。 换做其他职业重回十年前,靠类似btc这样东西财富自由不难,但想站在世界舞台的最中心,卷起新时代ai这样等级的风暴,却是不那么容易的。 “孟狗,什么情况?今天真能送啊。” “兄弟服了啊,你这玩得是个啥?手跟脚一样。” 工作之后,孟繁岐lol玩得都很少,更别提dota2了,手生得不行。一上手便狂送了两盘,一己之力打崩了局势。狠狠坑了两个室友两盘之后,孟繁岐连忙推脱道,“今天有点心事,实在对不住,你们再开两把,我查点资料。” “行行。”另外两人倒也没有多说什么,急着赢一把去了。 千里之行始于足下,自己的重生ai之路如何迈出坚实的第一步,这件事还需要稍微计划一下。凭良心讲,虽然自己精读了不少着名论文,也大致看过主要的代码实现。 但非常现实的事情是,ai的技术更新迭代很快,同时期类似的想法也很多,好的想法还需充足的实验结果佐证,加上审稿的周期非常漫长,不是他现在马上发了一篇论文就万事大吉的。 同期类似的算法和技术数不胜数,自己一没有大量计算设备去准备海量的结果,二没有知名导师背书确保文章不会被人忽视,三没有在大型企业实习缺少宣传手段。自己贸然发出一些ai算法文章,有很大的可能会被忽视,甚至被不懂的审稿人拒掉。 更糟糕的情况,启发了其他学者,使得他们在自己的基础上很快做出自己现在无力负担的大量实验结果。或许之后会有人提到,其实该技术由华国的孟繁岐更早提出。但真正的实惠早就被人都得去了。 “尤其这个时间点,各种ai相关的代码库和工具都不够完善,我当年学的很多东西实现起来未必方便。想要马上准备够发一篇顶级论文的实验结果,根本是不可能。”孟繁岐一连检索了很多熟悉的技术关键词,发觉可以查到的信息远比自己想想的要少。 “我学习旧的工具和框架也需要一定时间,急着发算法论文不能说是坏事,只能说没那么必要,时间上还算是宽裕。真正能获得最大关注和地位的永远是人机大战这样的事件。 只要取得大型竞赛的冠军,我就能真的获得ai届的关注。随后再把以后应用范围最广的技术写成论文,做一个挖坑人,让其他人慢慢在我的基础上填坑就好。” 修修补补的工作是得不到什么重视的,属于脏活累活。挖坑人是最赚的,只管挖不管填,坑里不知道埋葬了多少前赴后继的研究者。 孟繁岐现在能记住的算法和技术,自然都是经过了多次考验脱颖而出的同时代卷王和开创性工作。 只要取得了一次震惊业界的成绩,那么自己今后提出的所有算法,写出的所有论文,都会有一定热度,不可能被忽略,只会一次次的成功,不消两三年,深度学习ai时代的所有技术,基本上都无法再绕开自己。 所谓人的名,树的影。犹记得孟繁岐重生前还等着看诡秘之主第二部的连载呢,乌贼才发了30个字,卷毛狒狒们就已经几十万的打赏上去了,这就是大佬的号召力。 想到这里,孟繁岐已经锁定了自己的第一个目标,那就是ia超大型图像竞赛。 ia是深度学习时代早期最重要的大型竞赛,2010年到2017年,所有的图像算法,最能证明自己价值的办法,那就是ia上取得好的成绩。 冠亚流芳百世,其余无人问津。唯有胜者通吃一切。 “2012年的比赛刚刚结束没多久,世界应该还处于alex的震撼当中。” 孟繁岐点开ia的网页界面,大概浏览了一下几个月前结束的比赛信息。 “距离13年的比赛开始还有大半年的时间,我得尽快做出准备。” ia的数据量非常之大,1400w张图片的量级需要相当良好的设备支持,这个东西可不是自己现在的小破笔记本电脑就可以跑的。 这也是为什么孟繁岐觉得自己必须要在今年秋天的时候提前出掉自己一部分btc,这笔消费是不可避免的。 “我这卡尔真秀啊,太牛了,两秒钟放十七个技能。”一旁的两位室友似乎获得了一场大胜,正在疯狂的吹嘘。 “牛什么牛,还不是要靠爸爸来拆高地?”刘旭丝毫不捧场,转过头来注意到孟繁岐面前的屏幕上全是英文,不由得惊诧道,“什么情况?跑到网学习来了?” 唐璜闻言大惊,连忙跑来摸了摸孟繁岐的额头,“别不是烧坏了?” “烧什么烧。”孟繁岐一挥手拨开了自己头上的狗爪,“小心爸爸剁了你的爪子。” 第4章 感谢内卷的面试文化 其实孟繁岐也曾无数次幻想过重生这样的事情,在他的梦中,事业,爱情的进展总是神速,一帆风顺。 然而当真有机会重新走在十年前的大学校园里,孟繁岐却发现,也就只有买买btc这种事比较容易做。 他没有异界默写《红楼梦》,倒背唐诗宋词三百首的记忆力。 而ai时代代码和工具的更新换代又是如此迅捷神速。 截止此时,别说是后世二分天下的两个ai工具没有发布,就连更早的caffe都没有开始开发。 整个学界还在alex大地震的余震当中,学界不少人连深度神经网络到底长什么样子还没完全搞清楚,又哪来的现成框架给他使用呢? 孟繁岐走在回宿舍的路上,开始思索怎么应付重生回来的第一个难题,服务器这东西只要熬过这几个月,出一部分btc就够买。 而参赛拿了第一之后,谷歌可不会吝啬几台机器借你用。孟繁岐非常清楚这段往事,只要顺利实现算法,谷歌开给自己的将会是一个天文数字。 比较麻烦的是构建这个模型要用的代码框架。他开始接触的那会儿,最火热的工具是15年出的tenrflow (tf),又过了两年,17年脸书(face)提出了pytorch,更加易用,渐渐后来居上。孟繁岐便也转而使用pytorch居多。 再之前的一些框架,他有所听闻,但诚实地来说,确实从来没有接触过。 越到后期,各种包装就做得越好,即便是小学生来了也可以两行代码直接构造一个高性能的前沿模型。 但那到底是十年后了,如今距离tf发布最初版本还有两年多,孟繁岐有点烦躁。 他目前的计划是去看一看去年alex最初版的源码,再去看看阿里克斯本人的主页,应当会有一些收获。 实在不行,就只能乘着阿里克斯如今春风得意,又还没有签约谷歌的这段当口,多套近乎,向他请教。 由于alex是深度学习时代的里程碑事件,其模型名称又以本人命名,因而孟繁岐对其论文,网络乃至本人都稍有些了解。点开网页搜索其人的姓名,很容易就能在多伦多大学的网站上找到其简洁的个人主页。 不仅如此,这个个人主页上还详细记载了他在校期间自己开发加速的一些代码。主要是c++和基于英伟达显卡的cuda代码,基本上在10年-12年这个时间段。 “好人一生平安啊!”孟繁岐点开链接,发现他不仅是代码和结果记录在里面,就连每次的改动修正了什么也都记得清清楚楚,甚至旁边还留了一句言,“如果有任何代码跑不起来,请随时联系我。” 孟繁岐的眼中流出了两行热泪,正是因为一代代算法开创者如此无私的奉献和分享,ai行业才在十年中发展的如此迅猛。 “好代码,我抄!”数据和代码都在下载之中,如果这个cuda-nv的框架可以使用,那代码的问题其实就算解决了一半,孟繁岐完全可以基于这个雏形框架先初步实现一些比较关键的算法。 想到这里,孟繁岐不得不由衷地感谢后世越来越内卷的算法面试。 他对自己的能力认知非常清楚,即便是重回十年前,他的代码能力也并不突出。他的优势在于清楚很多技术和公司的发展路线。 之所以对这些着名的算法技术了若指掌,并且能复现其中相当的一部分。还得多多感谢程序员特色的面试机制。大一些的企业,一次面试面你三轮五轮技术,现场考你写代码,问你经典技术让你实现,那是司空见惯了。 加上程序员这群人又特别喜欢分享,酷爱写“面经”也就是面试的经历和经验。往往又有好心人针对这些问题提供非常详细完美的答案。 如此来回反复几年,大企业为了筛选人选,题目也是越出越难,越出越加刁钻。因而使得孟繁岐对各个路线的基本核心技术和经典论文烂熟于心。 只是后世早有人把工具写好,了解这些经典原理在工作中没什么大用处,却没想到竟能在这里物尽其用。 除了代码之外,另一个要紧的任务就是几篇重要论文的细节和推理论证。 孟繁岐基本记得主要的脉络和逻辑,但细微之处却不周全,还需要好好努力打磨一番。 如果想要分最大的蛋糕,要做的事情还是相当多的,孟繁岐仔细盘算了一下,许多日后ai方向的基石,其实大都在13-15年这段时间提出。 并且,如果自己频频提前一两年提出算法,发表论文的话,很有可能引起蝴蝶效应,使得领域内的进展更加的快速。导致自己的时间比原本要越少。 因此,孟繁岐初步规划,在前一到两年,也就是到15年左右,尽量把日后各个方向的最核心算法给实现或者提出理论。 随后15-18年,主要利用已经换取的资源,经济资源也好流量知名度也好。转移重心把自己的精力主要放在突破人类水平的那几个项目当中,如ai围棋,ai游戏,ai绘画和ai语言等。凭借基于自己算法的ai频频创造击败人类顶级水平的记录。论文只需要少发几篇重要内容就够了。 一旦过程中积攒了足够的资产,便可以提前大规模持股一些科技公司。等到18-19年,自己便可以逐渐转型,渐渐离开学术界,以投资或者ai创业为主以规避自己逐渐失去的技术优势了。 除此之外,如果说还缺什么的话,就只能是一个独立的住所。燕京电力大学作为一所电力写在校名中的大学,隔三差五晚上就给学生断电。有时候模型或者算法测试要连续运行几天,孟繁岐并不想整天被晚上的熄灯断电所影响。 况且电脑若是做算法工作,高负荷运行,动静极大。即便可以在宿舍做这件事,恐怕也会吵得室友们难以入眠。 在学校附近租一小间,自己这两年存的钱刚刚投了btc,实在没办法,只能问兄弟借一些了。 问兄弟借钱,辈分必然骤降。自己的ai教父之路还没迈出去几步,“叫父”倒成了真。不叫两声爸爸,那几个损货室友又怎么可能借钱给自己? “珍惜最后几个月抠抠搜搜的日子。”孟繁岐有些忧伤地拍了拍自己空空如也的钱包,“以后可能就再也不知道缺钱是什么感觉了。” 第5章 这课上了多耽误我学习啊 跟着老师学,毕业就失业。 这句话听着让人很不舒服,但在那些业界领先高校的专业当中,这却是不可以告诉大学生们的实话。 游戏原画,计算机科学等业界领先院校,并且极其强调实践的专业便是其中代表。 虽然很不愿意承认,华国高校的教育还是存在不少问题的。最大的问题就在于教学内容和企业用人标准完全没关系。 计算机强校可能还好些,像燕京电力大学这样偏重电气电子的大学,在这方面的准备可以说是相当糟糕了。 孟繁岐前世本硕都是电气,一身计算机和代码相关的功夫全靠自学。如今既然重读一回,自然便蹿到了隔壁软院的课堂上来。 却不曾想老教授竟然只在讲台上念ppt,课后的代码作业要用word提交?简直荒谬绝伦啊。 孟繁岐坐在教室的最后一排,看到不少人还在笔记本上手抄ppt上的代码,感觉精神受到了很大的冲击。“龟龟,这课要是上多了,感觉对身体有害啊,非常耽误我的学习。” “听教授念ppt也就图一乐,真大学还得看哔哩哔哩。” 别的不说,这些视频网站上不知道哪里搞来的一流大学公开课确实相当不错。 两度辗转,离开了电气的课堂,又离开了软院的课堂。 孟繁岐来到了学校北边不大的一个图书馆前。 实话实说,他不管是上辈子还是这辈子,确实没有踏入过这里几次。 “我的天,这是谁来了?”还没进入图书馆中,正巧碰上室友,学霸一平从图书馆出来,“实在是稀客,稀客啊!” “真够贫的,哎,问下,图书馆有插座的座位在什么位置?” “三楼,上去左转往里走就是了。” 孟繁岐来图书馆自然不是为了借阅什么书本,眼下他需要的资料大都极新,需得要在近两年发布的顶会或者顶刊论文集中才能找到。 同时,他对这段时期的工作,比较具体的时间节点了解也比较模糊,无法确认到底什么内容已经发表,而什么内容尚在研究之中。 因此,也需要大量的时间去熟悉和确认,这样才好决定目标。 况且英文写作论文也非易事,读研时他曾有一次期刊两次会议的发表经历,也都是四年的工作之前了。这种事情熟能生巧,一年不做便会手生。 孟繁岐翻阅了一会去年的论文集,确认了各个方向的研究进展之后,便打开在线论文编辑网站,overleaf。 他准备先把各个方向的核心算法先梳理一遍,一方面为了避免时间久了自己渐渐淡忘,另一方面也好分清轻重缓急,尽早开始算法和论文的准备。 都什么年代了,还在用word写论文?孟繁岐回忆起自己本科的时候搞毕设写论文时候的种种。 word这东西何其不便。调整字体不方便,插入超链接不方便,插入论文引用更是不方便。就连字数和页数多了都会卡。 我如果只需要调整几个标题的字体和大小,我如果突然要改论文引用的格式,我word中的论文公式在导师的老古董里打开是乱码 凡此种种,不一而足。 但凡哪一种情况发生,等待你的都是漫长而无意义的修改和劳作。 尤其对导师来说,指出你文章哪里标点不对,字体不对,格式要改。往往也只是一句话的事情。 甚至他可能过几天又让你改回来。 即便你的导师再好,不使唤你修改,可若是论文被拒,需要改投其他期刊,这种事情总是不可避免的。 “自从用了tex写论文,嘿!我腰也不酸了,腿也不疼了,一口气上十楼不费劲!”孟繁岐拉下ai顶会cvpr的tex模板,念念有词地使用overleaf网站开始编辑。 tex实际上是一种语言,在overleaf上的使用tex编辑,界面是一分为二的。 页面的左边以类似代码的形式编辑你的文本,图像和公式,而右边则用于显示自动排版之后的结果。 不同的会议和期刊经常会提供自己排版的tex模板,直接复制进去就可以投稿。他室友唐璜前世就精通斐波那契投稿法。被拒稿了看都不看,直接复制进另一个tex模板里,点击,提交。全程用不到十几分钟。 文章引用也可以单独存放在一个bib文件里,引用格式的改动也是完全自动的。 图书馆内,韩辞就是这样一位正版word软件的受害者。 她今年大四,十九岁,准研究生desu。 在数学和物理上的出色天赋让她有了跳级的资本,出色的竞赛级双科成绩保送了她两次,但几次跳级带来的压力也让她的人生经历中,缺乏足够的时间去接触学习之外的信息。 现在她在写的这篇论文不算太长,但数学公式极其之多,全部都是她用word的公式功能一个一个敲上去的。 现在快写完了,她回顾整个内容的时候删掉了一个不那么必要的公式,为求更加简洁流畅的证明。结果更新一个公式编号,word就卡住了。 上面的那个小圈一直转一直转,韩辞的双手放在胸前,整个人上半身前倾把双手压在桌上。小圈转啊转,转啊转,转了好几分钟了。 韩辞渐渐有些焦急了起来,右手轻轻锤了几下桌子,敲击的动静引起了孟繁岐的注意。他转头看了一眼,没有太在意。 转啊转转啊转,word整个界面突然白了,同时变得惨白了还有韩辞的脸色。 “应用程序没有响应,如果您继续等待,程序可能会响应。您想要结束这个进程吗?” 韩辞深深吸了一口气,她不记得自己上次保存是什么时候了。 孟繁岐微微皱眉,又往自己右边瞥了一眼。上次他压根就没细看,这一眼稍微仔细看了一两秒钟。 脸转回屏幕这边,他微微摇了摇头。小姑娘看着挺文静秀气的,怎么这么不安分,老在图书馆发出声音,这不是影响自己学习吗? 韩辞又等了几分钟,发现自己被骗了。 它说如果继续等待,程序可能会相应。自己每次都等,结果从来都不相应。 想着想着,韩辞觉得自己特别委屈,感觉鼻头酸酸的,嘴巴也噘成了一个倒u形。 平常这个时候她都会选择直接回到自己的床上,遇到困难,睡大觉! 但今天她长途跋涉从燕京大学跑来这鸟不拉屎的地方找自己以前的同龄好友,燕京电力大学的大一学生麦芒。 她来早了,现在好朋友还在上课,暂时过不来。 韩辞越想越委屈,越想越委屈。 要不是自己在这里等她,怎么会想到要修改一下自己的论文。 如果自己不修改论文,程序又怎么会卡在这里。 越想越觉得自己很有道理。 “哇!都怪她。”韩辞心里这么想着,哇得一声就埋头哭了起来。 “龟龟,怎么了这是?”孟繁岐一脸震惊地看了过去,现在学生压力怎么这么大啊,学着学着就把自己学哭了? 第6章 额,我应该叫你学姐还是学妹 “同学,你没事?”韩辞的打扮看上去挺朴素简洁的,孟繁岐觉得这是个挺乖的好学生,便决定关心一下。 这其实是一句词不达意的客套,在你问别人有没有事的时候,通常代表对方非常有事。 “没没事。”韩辞感觉有点不好意思,连忙用手背抹了一下眼泪。 佯装无事发生。 但自己电脑上word仍旧卡在那里,一时间她竟不知该做些什么。 “额同学,你的程序好像未响应。”孟繁岐见她盯着屏幕一直看,搞不懂有什么好看的,这不是弹出了一个窗口把中间都挡住了吗? 韩辞小脸一红,她感觉自己的智商被轻视了,这在她的人生经历中还是比较少见,一时间竟不知如何应对。 “word编辑公式多了是会这样的。”孟繁岐仔细看了看她的屏幕,总算大概明白发生了什么事情,“很容易卡顿,而且还有比较小的概率出现乱码。忘记保存或者不小心保存了乱码都是很麻烦的事情。” “而且,你们数学系不用tex类方法吗?”如果说其他偏文科类一直用word还情有可原,数学系的学生应该还是会很早接触tex的。 “你导师也不提醒你。”孟繁岐以为她已经读研了,心中感叹这学姐看着真年轻啊。 “我我刚刚大四,是第一次写论文。”韩辞大三就已经确定了导师,是燕京大学的鄂维南院士。但她其实并没有和未来的导师有太多的交流和交集。 一方面,时间还没有到,她虽然连番跳级,但距离正式读研仍尚有一年。另一方面,鄂维南院士虽然是燕京大学教授,华国科学院院士。但其人在美国亦有经历。曾在普林斯顿任职,并入选美国数学学会。 选大佬做导师也是有好有坏的,大树底下好乘凉,但树实在太大了之后,确实也有些顾不上底下的小猫小狗三两只。可能大几个月甚至一年也见不到几次。 事在人为,韩辞便打算通过自己的努力来博得关注。 听对方解释完内情之后,孟繁岐恍然大悟,决定施以援手,拯救这个正版word的受害者。于是便将自己的电脑拿来介绍了一番。 “学姐,这样去写论文的话,即便是公式其实也是普通文本的形式,奇怪的符号也可以批量查询更换,至于公式的编号更是会自动生成。” 孟繁岐为韩辞大概演示了几下基本功能,继续道“你还可以给图片,表格或者公式什么的起一个自己熟悉的名字,在任何时候提到其中的内容,就直接引用,\\ref{}这个名字。” “至于论文的引用,也很方便,你看论文的时候点击文章下面的‘引用’,选择bibtex,把它复制到这个bib文件里就好。看见第一行这里了吗,这个名字你可以随便修改成自己好记的。然后正文里随时\\cite{}这个名字就可以引用了。它的详细信息会自动出现在最后面,换格式也是自动的。” “哇,这么神奇的吗?”韩辞感觉新世界的大门已经向自己打开。 “这才哪到哪?复杂的公式还是需要自己输入。”孟繁岐摇摇头,虽然tex可以很方便地展现和修改公式,但想要输入还是比较繁琐。“等过两年图像ai技术成熟了,公式自己手写出来,拍个照就可以自动生成各种格式。” 孟繁岐还记得athpix这个插件,好用至极。不管是手写的公式还是看到一个公式,只要截图,就可以直接转换成tex格式,复制到自己的论文中,简直就是写轮眼。 “你是说ocr技术吗?”韩辞大概稍微听说过一些,“不过那个现在还没有怎么发展起来,我记得识别一些数字就已经是极限了。” “不会太久了。”韩辞实在没有想到孟繁岐此时这句不会太久了,竟然真实的含义是“不会太久了,我会出手。”还以为他对这方面过于乐观了。 “你在写什么东西?你不是研究生吗?干嘛叫我学姐。”女生对年龄总是有点在意,尤其韩辞这样连续跳级的,走到哪里都是小师妹。被连续叫了几句学姐之后,很是在意。 此刻,看到孟繁岐也在写论文,更是觉得这人故意把自己叫老了。哪有几个本科生会这么专业用英文写作论文的?对工具和格式的使用如此熟练。 韩辞细看文章的摘要。这是孟繁岐计划用于年末赛事的算法简述。 “更深层的神经网络训练十分困难,我们提出了一种简洁的方式极大地改善了这种情况,并使得网络的深度可以加深十倍乃至百倍,训练百层,千层的神经网络成为可能。 我们显式地将层的学习函数reforute为一种残差的形式,证明了这种方式更加容易被优化,可以获得明显更高的性能。 深度的表达能力在视觉任务上尤其重要,我们提供了相关的分析,并在ia和cifar等数据集上取得了xxx的成绩。” xxx的部分目前还没有准确的数字,还需要孟繁岐把war-up,批归一化,ix-up等比较容易实现的小trick都处理完成之后,实验才可以正式进行。因此暂时空在这里。 韩辞看完之后,只觉得这摘要简洁精要,英文的用词和语法恰到好处,但她的英文写作经验很少,倒也说不太明白是什么感觉。 虽然说不清,但看起来蛮厉害的样子。 “师兄,你是读软件工程的吗?还是读计算机科学的?”韩辞对这个内容很有兴趣,她明年的导师鄂维南正在燕京大学积极推动大数据,应用数学和数据科学。神经网络自然也在他的关注之内,“我导师好像也在搞这方面的内容,在推动什么大数据科学研究中心。” 严格意义来说鄂院士虽然本硕博数学出生,在美的时候也是数学系教授。但回到燕京大学之后,他正在极力发展的实际上是大数据方向。 不过此时华国还没有数据科学和大数据的本科专业,因此鄂维南院士主要从数学系吸纳人才和学生。 “我才大二,你为什么要叫我师兄?”孟繁岐不解。 “我才十八呢,你为什么要叫我师姐。” “十八读大四?”孟繁岐一愣,看来是一个少年天才类型的人物。 “额,我应该叫你学姐还是学妹呢?”孟繁岐沉吟了一下,“算了,咱们各论各的,反正女生几岁了都自称十八。” 第7章 兴师问罪 和韩辞聊了没太久,麦芒就蹦蹦跳跳跑来把自己的好友领走了。 孟繁岐对这个活泼的大一学妹倒稍微有些印象,此人的脑回路异于常人,经常语出惊人。 从两人的交流中得知韩辞原来不是本校生,这倒也是了,没听说什么跳级的天才来这地方的。 不过他倒也没有去多问什么,并不知道韩辞是燕京大学的高材生。自然也就没有反应过来,韩辞口中推动大数据发展的,就是机器学习,大数据和应用数学方向的领军人物之一,鄂维南院士。 此刻的鄂维南院士正忙于燕京大学的应用数学拔尖人才培养计划,韩辞便是其中之一。在他看来,机器学习和去年崛起的深度学习是应用数学百年未有的大机遇,不仅搞cs搞软件的要参与进来。搞大数据和应用数学的也一定不能错过这个机会。 只是他此刻恐怕怎么也意料不到,自己和卷起新时代ai风暴的后辈,竟然是通过一个还没有进入师门的学生开始建立起联系的。 ------------------------------ 重生回来之后的进展还算是顺利。 孟繁岐现在已经翘掉了所有的课程,不是待在图书馆看论文写论文就是尝试复现一些技术,调试并测试代码。 大学课程的出勤没有中学那么严格,但不少老师还是会偶尔点名。唐璜和刘旭会轮流暗中帮助他,只是时间久了还是遮掩不住。 其实孟繁岐并没有要求两位室友替自己答到,在他回到2013的那一瞬间,他就已经不准备在电气专业上继续投入任何时间和精力了。同样的,他也不觉得有任何需要扮演好学生的必要,前方的道路应该怎么走已经非常明显了。 唐璜和刘旭对此有些担忧,他们认为孟繁岐彻底堕落了,毕竟他们实在很难想象室友翘课之后竟然在高强度学习和钻研前沿ai技术,而不是高强度网包夜。 “儿啊,你这样下去不行的。”晚上三人聚餐的时候,唐璜一脸担忧,表情之中隐约带有三分慈祥。“夜不归宿,课也不上,这样下去搞不好有劝退的风险。真要挂太多科也是麻烦事。” “去上课不也是形式主义?”孟繁岐心说,你小子还有脸说我,“你上课整天抱着个手机在那里玩,不是看小说就是打手游。人在心不在。去上课又有何用?” “话是这么说,但表面功夫也是功夫嘛。”唐璜脸皮很厚,丝毫不以为意,“况且你也知道,我们院导员管得那么紧,上回哥们替你答到,也不知道被谁举报了。导员早上还找我来着,问你去哪了,我没跟他说。” “管他做什么,他整天就想着别出了什么问题影响到他,什么时候真的关心过学生的事情?”孟繁听唐璜提到院大二这一级的辅导员,嗤之以鼻。 大学辅导员按理说负责学生生活,但他们这届的这个导员正经的事情是一个不管。 学生生活上遇到难处,经常找不见人。各种私事需要请假批条的时候,总是一而再再而三的拖延。 此外,还总喜欢推动建议一些愚蠢的活动,折腾学生做给领导看,以作为自己的行政成绩。 比如数不胜数的强制性自习课,不参与就在批假条,奖学金等事情上百般为难你。 最最离谱的还是有一次搞了两周的清晨集合晨跑活动。 把一群大学生六点多搞起来在操场上列队给校领导看,绕场慢跑两周,“以显示学院新生的新风貌”。 孟繁岐对此意见很大,他当时的抗议方式并非是拒不出席,而是全程坚持穿着全身连体的恐龙睡衣,跑起来摇头摆尾,接近半米长的大尾巴左摇右晃,在人群之中甚是显眼。 校领导看后哭笑不得,把他叫去跑道旁边谈话。孟繁岐据实以告,校领导倒也没有什么架子,并没有难为他。 只说,“上面的意思和想法还是好的,只是下面的执行上出现了一些问题。” 而后这一愚蠢的晨跑便也取消了。 身着全身连体奶牛睡衣的唐璜在一旁听了个全貌。 “上面的意思和想法是好的,但下面出了问题,这不就是羊尾吗?” 这话很快在全年级传播开来,众人顺着这个逻辑继续盘下去。按这个说法,该导员似乎成了第三条腿,应当简称为“小x宝”。 曾经旗帜鲜明地反对小宝,孟繁岐自然和他早就相看两厌,倒也没在意什么。 却没有想到两天后的下午,小杰宝在一位同学的带领下,气势汹汹地前来兴师问罪。 孟繁岐仔细分辨这位同学的样貌,似乎有些印象。 大一大二的学生像他这样在外租房的确实少,但也不是没有。 孟繁岐楼下同班同学有一间宿舍,就有两人大一就搬了出去。 该宿舍常年弥漫一股若有若无的怪异狐臭,极其飘忽不定,踪迹难觅。据说是几个月了都是只闻其臭不知其人,始终没有找到凶手。 孟繁岐多多少少也曾串门拜访,只一个照面就感觉被触及了灵魂的深处,待不了多久就败下阵来。 而后先后便有两人愤而搬离,怒斥千余元每月在学校附近租住。一年下来也要万把块,代价不可谓不大。 两人自证清白之后,嫌疑人便缩小到四人之中,此后再经过了几番波折,似乎最终查明了就是源自眼前的这位黄同学。 “孟繁岐,你现在整天课也不上,自习也不去,你想干什么?”小杰宝在黄同学的带领下找到了孟繁岐。“装模作样地整天泡在图书馆里,吓唬谁啊?” “他怎么知道我整天泡在图书馆里?”孟繁岐惊到,这事情就连唐璜刘旭两个狐朋狗友都不知道,也就学霸一平最近碰得比较多,但他可不是那种会打小报告的人。 坏了,不会是被这坨黄翔跟踪了?黄同学本名黄襄,后被查明不爱个人卫生,乃是宿舍内的瘟疫之源后,便被称为黄翔。 “老师,我不学电气啦。”孟繁岐微微叹息道,“我学电气的未来发展是比较有限的,在我短暂的人生里我学到一件事情,决定放弃的事情是没有花时间和精力去掩饰的必要的。” 第8章 意外的指点 “不想学电气这个专业,可以好好考到年级前列,然后想学校申请转专业。而不是这样自暴自弃。”小杰宝表现得一副语重心长的样子,但孟繁岐很清楚,他只是担心怕出了劝退之类的事情,有可能会影响到他作为导员的成绩。 “这本身就是矛盾的一件事情,我不想学或者学不会一个专业,却偏偏要在这个专业里考到前面才有机会转专业。”孟繁岐可以理解这种规则是为了限制大规模转专业的行为,又或者是为了保护一些冷门的学科。 你或许可以限制他更换专业,可他毕业之后会从事这方面工作吗?甚至说,这方面的工作岗位到底有这么多吗? 通过这种方式让许多人困在自己不想学的专业之中,只能通过考研或者社会上的培训班再更换行业,以求得大学内某专业看上去欣欣向荣,实际上也只是掩耳盗铃罢了。 “况且老师,我并没有自暴自弃,在过去的这段时间内,我一直在努力学习和研究新领域的前沿知识。”孟繁岐指着自己的电脑屏幕,上面是他有关“批归一化”论文的草稿,主要讨论的是深度神经网络训练过程中的内部协变量偏移问题。 “实在不行的话,我想休学一年。”孟繁岐也曾考虑过这个问题,他一方面已经放弃电气方向的学科,另一方面还没有资本转去相应专业或者前往其他高校继续就读。 办理休学,学校和学院的一些琐事就不会影响到自己。但考虑到办理休学,学校方面很难会不知晓自己的家长,孟繁岐思忖了一下,还是没有做这个决定。 家中父母为了自己付出了不少,眼下一时间很难拿出二老能够理解的证据让他们放心,孟繁岐不希望影响父母的心情和日常生活。 “你不要随便拿一些英文的文献来忽悠我。”其实导员看到这里已经有些相信他的话了,但他今年已经跟学院领导夸下海口,绝不会让学生有休学劝退记大过这样的事情发生。“倘若你还是这样嘴硬,我只能请你的父母来学校一趟了。” 孟繁岐听到这里眼神一冷,若导员真是为他着想,这事情不是不能解释开来。但他心里清楚的很,这多半又是他自己的小九九。 “不用搞得这么麻烦,不就是学生的兴趣有些转变吗。我们在大学做工作的,应该关注学生的想法,关注学生的需求。为学生提供更好的环境和条件。动不动就麻烦学生家长,像什么样子?我看这位同学电脑屏幕上的草稿就有点意思。” 一个面相儒雅的中年男人不知何时出现在了导员的深厚,他的打扮略有些讲究,戴着一副无框的金丝边眼镜,梳着背头,发路丝缕分明。 “付院长?”导员看清来者的长相,吓了一跳,“您怎么到这儿来了?” 付德清是燕京电力学院数理学院的院长,虽然数理学院在该校不是什么大院,但付院长还兼任校党委内要职,因此地位颇高。 总想着往上爬的导员看到付院长之后,顿时便偃旗息鼓,陪着笑脸道,“一切交由付院长处理,我不打扰,我先走了哈。” 孟繁岐连忙起身,他看出来付院长来此不是偶然,大有可能是特意来找自己。 但思来想去,想不出自己有什么地方会吸引到别院的院长大驾光临。 “深度神经网络训练中的内部协变量偏移会导致较深层的输入分布收到严重的影响,深层的神经网络为了适应被偏移的数据分布,只得采用保守的方式优化参数,从而极大影响了训练速度和训练难度。”付院长也未解释这点,只是自顾自地看起了孟繁岐屏幕上的内容。 “你这里说的深度神经网络指的应该是你自己提出的那种上百上千层的神经网络,而不是目前业界的深度网络?”付院长转过头来,微笑问道。 “付院长您是怎么”孟繁岐先是愣了一下,然后猛地反应过来,目前只有那个女生看到过自己提前准备的残差网络草稿。“是那个女生跟您说的?” “哈哈哈,她是我的小师妹。”付院长笑道,“前段时间来这里,也顺便来拜访了我一下,提到了我们学校有个学生在研究什么深百层千层的神经网络,研究得像模像样的。” “说实在的,这也不是我的领域,如果不是以前的老师让我关注一下这方面,我还真是一窍不通。这两天我还在查询资料呢,我说这哪有什么上百层的神经网络,去年年底那个夺冠的alex不也才8层的深度吗。” “我也只是刚刚有一些想法。”孟繁岐连忙解释道。 “你不用紧张,我只是稍微有些好奇,想看看咱们学校到底是不是出了个这方面的天才。若是真的,我肯定大力支持。” 孟繁岐连忙先请付院长坐下,先为他大概介绍了一下背景,原理和现阶段难题。 付院长本身是纯数学出身,此前又在老师的指示之下对这个领域稍稍了解过一些,因此孟繁岐没说太多,他就已经掌握了大概。 “你认为深度网络难训练的问题本质上是梯度问题,所以你想使用残差的形式。”付院长喃喃自语,左手握拳,撑住了自己的下巴。 “如果不去深究神经网络本身的变换,而只是将其的变换理解为一个未知的高维函数的话,f(x)的多次累加会比x+f(x)的残差形式要不稳定太多。”孟繁岐后世主要以理解算法的流程,了解几种对比方法的优缺点为主。 对于其具体的内在原理,数学推导,平心而论,他的关心远远不足。现下正是弥补这部分短板的大好机会。 “如果我们讨论一个函数的多次嵌套,f(f(f(f(f(x)))))的话,不管是否是残差的形式,都是相当难以分析的。从数学上直观来看,两个相同次数的嵌套,有残差与否,不应当会改变该函数的实际表达能力。也就说,你构建的模型其对函数拟合的能力是与原本相当的。” “倘若真的可以观察到明显的改善,那说明这种残差的形式只是能够让你所说的模型更容易被优化。换言之,以我的视角来说,该函数的求解变得更加精确了,从这个角度来看,残差是一种简洁的欧拉前向形式。” 付德清说着,拿起了纸笔开始了一些推演。孟繁岐疏于数学上的推演,但他很熟悉这种形式构建的网络有什么特性,因而越听越觉得惊奇。付院长的数学分析竟然相当接近不少后来的实验结果。 只可惜自己看他亲自上手推论,却稍微有些吃力了。 此时此刻和他一样一头雾水的还有附近竖起耳朵吃瓜的几名高年级学长学姐。 第9章 徒儿已经全部忘记了 “这到底是怎么个扑朔迷离的剧情?” 早先见电气学院的导员气势汹汹的找来,还以为这小子是个问题学生。 怎么就峰回路转,变成如此高深专业的讨论了? 我是谁?我在哪?他们到底在说什么? 为什么每个字我都认识,连在一起我就完全听不明白了? 时间缓缓地流逝,不知不觉间,付院长的草稿和推演已经写满了六七页a4纸。 “如果单纯用y=f(x)+b的方式去理解一层的行为,那么对于任意正整数k,都存在一个k3量级深,常数量级宽的神经网络,无法被一个k层的神经网络拟合,除非其宽度为原本的2k倍。” 付院长越计算,越觉得这小子的直觉不错。 “倘若依你所说,用批次归一化的方式去避免协变量偏移的问题,再加上非线性的函数为层提供额外的表达能力,那么甚至在极端的情况下,需要2k3倍的宽度。这样看来你首先专注于解决深度问题,然后考虑去处理训练难度问题的思路是相当聪明的选择。” 付院长,沉吟了一番,回顾了一下自己的计算过程,问道“懂了吗?” 孟繁岐非常严肃认真地摇了摇头,说“没太懂。” 付院长笑了笑,不急不恼,又将整个流程按顺序梳理了一遍。 即便孟繁岐前世已经精读过好几次这三篇论文,但始终没能从根本上理清其中的数学关系。ai界与数学界看待这个问题的视角截然不同,付院长带给了孟繁岐新的认识和理解。 有一位资深的数学教授为他梳理了背后的数学原理和关系,孟繁岐顿觉豁然开朗,但却又始终迷迷蒙蒙,隔着一层纱布。 仔细再看良久,好像有些明了了,“现在好像有些懂了。” “再多看几遍巩固一下。”付院长闻言站起身来拍了拍孟繁岐的背,说道,“我的办公室就在数院大楼503,如果有这方面的问题,欢迎你来找我讨论交流。” 说罢,便转身离去,也不问孟繁岐究竟叫什么名字,只做纯粹的学术交流。 临走前,还对旁边伸着脖子围观的两个数院研究生使了一个眼神,大概意思是“你看看人家,才本科,文章都快写出来了。看看人家看看你。” 两位数院研究生连忙低下头来移开视线。 只留下孟繁岐一人对着复杂的论证过程反复品味,又过了一会儿,孟繁岐感觉自己好像理解了,但又好像全都忘记了,进入了一种玄而又玄的状态。 想必当年张无忌学张三丰的太极剑就是这个感觉。 ----------------------------- 来自数理学院付院长的友情指导,弥补了孟繁岐当下论文大业中最薄弱的一环,足够扎实的数理分析和公式推论。 在ai学科的中后期时代,由于始终没有发现真正可以令人信服的理论,来解释深度神经网络强大的威力。因而许多注重性能和实用方向的文章,越来越像实验报告,而非论文。这点一直被很多人诟病。 投稿人数又每年暴增,大约在17年左右,ai相关的领域变成了不少科研人眼里的洪泛区,滚滚长江都是水,浪花里也淘不出几个英雄。 不过在目前的时间点,不少大会和期刊的审稿人还是相当注重理论部分的,如果这部分的论证和推理不够清晰流畅,即便你的结果再好看,即便你是ai三巨头之一的lecun,也会被无情拒稿。 孟繁岐机缘巧合,获此殊荣,倒也没有扭捏客气。他早期需要尽快成型的论文有十数篇之多,其中困扰他,让他不知如何下笔的不在少数。 如今有这等良师,自然要频频请教。 他也并不需要付院长抽出大把时间看具体的文章,只是在几个关键公式的起承转合上,自己前世阅读时从未曾在意的细小甚微之处,为自己拨开那一层若有似无的面纱,得以窥探其中真正的奥妙。 几周之后,某一个周五下午的五点左右,孟繁岐刚刚从数院大楼的院长办公室走出来。 里面的付院长却没有按照惯例起身去食堂吃饭,而是将这几次孟繁岐所提问题的纸张又都全部拿了出来,细细端详了一番。 虽然付院长对于深度学习和图像算法这里来说,专业并不对口。 但图片内容如果想在显示器上展示,在电脑中存储,终究还是要以矩阵的形式。其实说白了就是一堆矩形数字,就如同魔方的一个面,上面是九宫格可以存放九个数字,那就是一个3乘3的正方形矩阵。每一个数字就是一个像素,也就是图像的最小组成单元。 要论矩阵之间的运算和变换,付院长可就是这方面的宗师人物了。 虽然孟繁岐从未拿着整篇的论文过来,但从这些零散的问题,以付院长的水平已经能够管中窥豹。 “我们第一次讨论的是极深的深度网络优化问题,他提出的残差和批归一化,应该属于模型结构的范畴。” “但他之后又找我讨论一阶和二阶的梯度计算,以及几种变体,这应该是参数优化器的内容。” “再往后,他又询问了一些误差的分析和传递,这是数值分析的内容。”付院长眉头紧皱,仔细思忖道,“这应该涉及的是计算机内对同一数字的不同方式的存储,存储的方式不同,占用的计算机资源自然也不同。但其中也势必会引入一些误差。” “而今天,他问的东西越发具有想象力了。”付院长回想了一下今天孟繁岐问题的前提条件和背景,惊叹于他的大胆想象。“以两个深度网络,一个负责生成,一个负责判断。” “生成器持续地创造自己认为真实的图像,而鉴别器则负责区分输入究竟是真实的还是生成器生成的。” “这种相互对抗的方式,就可以摆脱模型的训练始终依赖人类先去为这些数据一一提供正确答案的人为监督模式了。” 付院长喃喃自语道,鄂院士积极推动大数据相关事宜,他作为排行前几的大弟子自然十分了解如今的数据量级,以及为它们一一提供答案、标签的难度和工作量到底有多大。 “已经是年轻人的天下了。”付院长长出了一口气,此刻,门外突然响起了敲门声。 第10章 两位休学人 “老付,你什么时候也学会了走关系递条子那一套?”教务主任曹维民也不等付院长有何应答,象征性地敲了两下门,便大步迈进来。 随即轻轻将门关上,说话的声音不大,但中气十足,其中颇带三分怒意。 “这能算什么走关系?”付院长如此说着,表情和动作却稍显局促。他本就负责校党委内偏纪律方面的工作,本人作风也向来硬朗。 若不是起了爱才之心,也不会一时冲动,去询问曹主任学生转换专业的事情。 “我与他无亲无故,又没有利益纠葛,行得正坐得直,我有什么可怕的?”付院长此举确无私心,这话没有半分虚假。 “我当然知道你付德清的品行,可你又何必在这个关头授人以柄呢?”曹主任上前两步,走到付院长的办公台前,声音再压低了三分,“你又不是不知道,再有几个月我们校羊书记退休,多少人都盯着你呢!” 羊教授现任校党委副书记,年事已高,年前就差不多定了秋天的时候退休,按正职享退休待遇。 现在虽然原则上付院长是最有资格的继任者,但相比其他两位竞争者而言,他的年纪明显轻了不少,因而所以不少人都觉得此事还有变数。 高校里高级别的坑位就那么多,想升上去往往需要静待前辈退休,曹维民与他相识已久,此时此刻自然为他着急。 “他们要盯便盯着,我还怕了他们不成?”付院长的倔脾气又上来了,“规矩是死的,人是活的。就这么几条转专业的规矩,不也是前些年才定的?” “咱们大学到底要不要培养好的学生,还是说就守着那点规矩,各人自扫门前雪,就算是万事大吉了?”付院长说着说着,想起一些往事,也有点来气,“咱们学校是电气强校,从来都是别的专业想尽办法往电气里转,我当年教数院,有几个是肯安心读数理的?” “大一转不了大二转,大二转不了大三转,实在不行考研转。不得已读完的出了校门也就把知识全丢了。来找我问问题的大抵就分两种,要么是装模作样博取我关注,要么就干脆是来求情,说自己想转专业,望我专业课能多给几分!” “如今有人从我们学校的顶尖专业想往外转,一,他不占别人想要的名额,二,说明他确实找到了自己擅长,且感兴趣的方向。” 说到这里,付院长刚刚略有些激动的情绪逐渐平复下来,“其实说到底,我其实也就是这么一问。咱们学校就算真给敞开了给他选,未必有他想要去的专业。” 听到这话,曹主任并不相信,“怎么着,依你的意思,燕京电力这座小庙,是容不下他这尊大佛了?他一个本科生,能有多大的能耐?” “倒不是说他多么天赋异禀,又有多么的聪明才智。”以付院长的眼界和见识,惊才艳艳的数理方向学生他见过太多,别的不说,他同门的这些师兄师弟师姐师妹,甚至于前阵子来拜访过的小师妹韩辞,个个数学能力都要强过孟繁岐不少。 “我见过不少天才学生,但其中不少眼光终究只限于已知和熟悉的领域。他们探索未知的区域缺乏一种视野和远见,盲人摸象,看不到整体而系统的东西。往往事倍而功半。” 付院长说到这里顿了顿,也不再继续长篇大论,而是转身将自己桌上,梳理好的那些问题与脉络拿了起来,“我说再多,也不如你自己仔细看看。” 曹主任久在行政岗位,看这些公式的推衍稍有些生疏了。半晌,才轻声叹了口气,说道,“难怪你对他赞赏有加,这里面的内容,很难说到底属于什么学科。可以说这是个非常新的领域,可能还要再过四五年,国内才会有成熟的学科体系和相应的师资力量。” 或许确实是自己过于死板了,曹主任的心中产生了这个念头。付院长前面有一句话问得很好,我们大学到底是不是为了培养杰出的学生,如果是,这样的事情自己必须去做,而且责无旁贷。 见曹主任态度转变,愿意帮忙,付院长不知道为什么心头有种欣慰的感觉。曹主任没有因为与自己的交情和关系松口,而是被他在学术上的成果和见解所触动。 这说明自己的眼光还是非常不错的嘛!竟然能让这个老古董违背自己的原则。 “行,你把这个学生的具体情况发给我,我回头替你查查。要是方便的话,就联络他看看,希望转到什么院更方便他开展研究。” “回回,马上就发到你手机上。”付院长哈哈大笑,一只手拉着曹主任往外走,一只手狠狠地拍着他的后背。 刚把人送出去没一分钟,便翻出后来交流中记下的,孟繁岐的学生信息。编辑好消息发到了曹主任那边。 夜长梦多,此事还是早些敲定为好。 只是却没有想到,不多时,曹主任便已经回信过来,“该学生已经在上周办理了好了休学手续,休学一年。” “休学?”付院长愣住了,这小子不是今天还在学校请教自己问题,这到底是个什么情况? -------------------------- 而此时此刻,孟繁岐正与另一位刚刚休了学的人,走在前往校园快递中心的路途上。 前世唐璜休学离开燕京电力而后转去海外其实是更晚一些时候的事情,如今受到孟繁岐的影响,休学这件事倒是提前了很多。 想必是找到了事情做的孟繁岐给了他不小的触动。 按原本的历程,他该是一番波折之后14年入学一所英国院校。孟繁岐见他无所事事,便拉他一同筹备竞赛,日后也好少走点弯路。 唐璜的加入提前解决了资金的问题,使得孟繁岐可以提前开始准备一台高配置的电脑,这样一来,许多原本不方便做的实验便不再是阻碍。 不多时,两人取走了最后一批diy主机的配件,大盒小盒地赶往校园南门,走在校园当中甚是惹眼。 “要我说你小子就是脑子不大好,你下单了倒是发到出租屋去啊!害得你爸爸我在这里当什么苦力?”孟繁岐感到很是悲愤,这小子就属于是伸出援手也能别人气个好歹的奇葩。 第11章 房 “把这些个东西搬过去,应该差不多就能组装上了。”孟繁岐看了看几个包裹上的信息,大概回忆了一下,“该有的好像都到了,送得还挺快。” 一般大学生租房的时候需要考虑的事情很多,饮食出行方不方便是重中之重。 学校里事情也不少,一旦有个风吹草动还得马上赶回。 燕京电力大学偏安一隅,五环朝外。要按四环和五环的距离来算,这得算是北七环。 只可惜北六环对付你自有妙计,在燕京北面以一个离谱的弧度绕出一个大弯,把五环外直线距离30公里以内的地区全都包了进来。 学校出门走两步就能上京藏高速,直接一路向西就能奔着布达拉宫去了。 这地方燕京的哥都不乐意来,孟繁岐读了一年多,在这里没见过正宗出租车,全是司机露着肚皮在外面准备拉客的黑车。 好在陆续办了休学的两人,这下是彻底不用在意学校的问题了。 两人抱着一堆大小各异的箱子,走在路上甚是惹眼,尤其是“nvidia force”的字样。 这时节显卡的概念和具体情况还没有那么流行到人尽皆知的地步。但大学生们多多少少模糊知道一点,这东西好像主要是用来玩游戏用的。 加上两人先后办理休学,倒也有些知名度。路上不少同学都觉得这两人怕是沉迷游戏,没救了。 “燕京的房地产远比我想象的要贵,不论是租房还是住房。”唐璜问询了孟繁岐之前租房的一些信息之后,略有些感慨。 “谁说不是呢,不查不知道,今年一月份均价才三万一平,这才九月已经涨到快四万了。”孟繁岐的语气中的震惊倒不是假的,他开始关注租房住房的时候已经是读研结束的2018年了,2013的房价对他来说即便在当时来看都是非常久远的事情,他还以为很便宜来着。 “dc区这时候就特么已经涨到六万了,我的天呐!”2022年孟繁岐背上房贷的时候了解过很多地区的房价,那时候尚海最中心的hp区房价是均价9-10万上下,他是真没想到燕京13年就已经腾飞到了这个地步,“现在二三环租一个单间都要1500+,真是难以想象啊。” “什么档次也想住燕京东xc区?还在做梦是?”一宿舍六个人,五个都不是燕京人。说话的唐璜出生ah,孟繁岐来自辽宁,刘旭来自四川,学霸一平是一位山东大汉,还有一位粤仔吕岳很会唱,跳。 “住在京藏高速旁边也要两万五一平。”孟繁岐摇了摇头,“佯装住在燕京,实际上进城要两个小时,何必呢。” 受到孟繁岐的影响,唐璜更早地开始思索思索毕业之后工作的问题,城市的问题,而不是心照不宣地忽视它,假装这个问题并不存在。 前世截止自己重生的时刻,也只有唐璜已经做出了定居尚海的决定。孟繁岐大概知道一点情况,他家里支持的力度是相当大的,大概直接出了一半左右的金额。 可即便如此,饶是唐璜那时节自己也有将近百万的税前收入,也不得不贷上差不多十年的款才能将将负担。而家里能不伤筋动骨就拿出六百w支持孩子,其本人又能有这级别收入的占比能有多少? 大部分人都是默默被平均掉的数字罢了。孟繁岐18-23年辗转了燕京和尚海两三次,终究还是选择了老家附近的大连。虽说这一代人独生子女居多,有时候不仅父母,就连爷爷奶奶外公外婆也愿意拿自己的棺材本帮助小辈。 但孟繁岐实在不愿长辈再多操劳,他们继续支持自己安家实在太过勉强。思前想后,他选择了在大连自己一力负担。22年的大连均价才一万五六,甚至远不及此时13年的燕京五环开外。 不用上班,没有贷款的感觉真好啊。 孟繁岐感觉燕京灰暗的雾霾天格外得蓝。“这种文化和氛围真的很奇怪,在这里读书生活工作,都不算是属于这里。只有买下一套房子,才算你真的有了家。” “走,争取晚饭前给它们都组装配置好。”来到地点之后,光是拆各种纸箱盒子就花了快半小时。 看着零散一地的组件,孟繁岐眼中仿佛已经逐渐出现它们成型之后的样子。 命运的道路在这里分叉。 孟繁岐瞥了一眼唐璜,他眼中有迷茫,有紧张,但是更多的是期待。 因为孟繁岐说服他出钱的时候答应了,如果得不到远超投入的回报,以后就叫他爸爸。 电脑的配置,显卡的型号在在ai兴起之后不是什么晦涩难懂的小众话题。 唐璜最初听说这模型要用显卡去计算之后有些惊讶,毕竟这时候大家对显卡的理解基本上只限于游戏。 若是自己告诉他其实最大规模集群的这东西甚至会被用来“挖矿”,一家公司能用掉一个区县乃至小城市几分之一的总电量,想必他的表情一定会很精彩。 “咱们真的用得上这么贵的设备吗?”gtx-690显卡一台大几千。更别提什么cpu,内存,甚至电源,孟繁岐在选购的时候也是抓着贵的买。 这个什么鬼海盗船电源,八百多瓦,一千大好几的价格,主板+cpu两套又是一万几千。 什么鼠标键盘显示器先不论,单独就是装在这主机箱里面的配件,一套就得小两万了。就这还不算这机箱本身。 “事已至此,想反悔也来不及喽。”孟繁岐倒也不是知道必能成功所以乱花钱。首先显卡这东西乃是运算推理的重中之重,乃是ai\/人工智能的最核心竞争力。 2022年,美国甚至发布禁令,禁止英伟达继续出售高性能显卡诸如:a100,给华国企业。 若不是担心现在各种生态和代码的适配问题,比较保守地选择了旗舰款,gtx-690。孟繁岐甚至想搞四路泰坦(titan)回来。 之所以没这么做,是因为此时多卡之间的通讯和训练代码很不成熟,自己根本没有时间去处理这个问题。 而cpu和内存则是因为,孟繁岐根本不知道15年tf时代前的诸多代码到底对显卡以外的资源依赖程度高不高。 毕竟要处理上千万级的海量图片,cpu和内存条千万不能马虎。既然钱包都掏空了,就不要吝啬这一点。 就连硬盘孟繁岐都没有上一丁点机械硬盘,而是配备了两个512g的固态,三星840 pro。程序需要频繁读取这一千多万的图片几十轮上百轮,这个时间可不能耽误在机械硬盘上。 “这特么两个硬盘要七千多块?”唐璜第一次看到看到孟繁岐列出的清单的时候,喝水都不会喝了,差点没把自己呛死。“你爸爸我去年买的笔记本才七八千。” 第12章 镜子前的狗们 他是答应要出资和孟繁岐一起参与竞赛不假,因为孟繁岐给出的理由十分充分。 “竞赛如果取得成绩,那对你明年去海外就读有很大的好处。退一万步说,就算一无所获,竞赛结束之后,不论结果如何这都是你自己的定制台式电脑。” 唐璜觉得很有道理,直接伸手问家里要顶配电脑的胆子他没有,但假借竞赛之名要这个钱的胆子他是有的,而且很大。 只是胆子虽大,却没有想到各个部件会如此昂贵。 好在什么键盘鼠标显示器还有机箱,倒是不关键,可以买得低配点。散热也是差不太多就行。 不过林林总总加起来,这台电脑的价格还是高达两万六千多。 “直接买个顶配品牌机多好。”各种组件堆放在地上,让这个本就不大的房间显得格外拥挤,无处立足。外行人一看,只觉得头晕,不知该从何处下手,唐璜很怕麻烦。 “散装我们钱都不够,你还想买品牌机啊?品牌机的价格少说也得有三成收得是你不会装机的费用?”孟繁岐知道他嘴上这么抱怨,但实际上还是很注重性价比。 “品牌机三成,名牌机得翻一倍?”唐璜哈哈大笑,室友旭哥作为足球,篮球迷,本身却很少亲身上场,不擅对抗。因此酷爱nba2k系列,实况足球系列等游戏。尤其以大胜班中的篮球健将,可以轻松篮的涛哥为乐。 今年旭哥刚刚重金购置了外星人笔记本电脑,结果不知道是散热有问题还是什么原因,总在关键时刻卡那么一下,让人非常恼火。 “装这个东西不难的,我装一次给你看看,以后你就学会了。”孟繁岐说着已经拿出了主板,压下主板上方的金属弯钩,掀开了保护盖。“这主板看似复杂,实际上大部分东西跟我们没什么关系,配件的安装都是防呆的,很好操作。” 主板上需要先安装的上去的东西其实也就是cpu,内存条两个,如果是风冷的话也可以先装。cpu只要打开盖子放进去再扣回即可,内存条则更是无敌傻瓜式操作,就是几条插槽插进去就行。跟小时候小霸王的游戏卡带没什么区别。 只是内存条不同版本的ddr卡槽的形状不一样,需要主板和内存条型号对齐。类似这样的小细节会让diy组装者的血压很高,一不小心就会买错。也正是因为如此,直到23年大家仍旧会觉得,新手还是直接买个品牌机算了。 再装上风冷之后,主板就可以先固定在机箱里了。其实自行安装电脑最烦躁的地方是线。从电源和主板处分出来的电源线五花八门,形状各异。电源给主板的,电源给显卡的,主板给硬盘的,甚至机箱前面按钮链接主板的。 “线的情况你们要看好,不要图省事就随意走线,丑倒是没什么,当心别把主板上留给显卡的插口给挡住了。”别问他是怎么知道这件事的。 不能熟练装机的ai算法工程师是不合格的,孟繁岐从头组装这种事情少说也做过五六次了,拆一半更换组件的事情更是不计其数,自然是轻车熟路。 在他的带领之下,两人有样学样,合力起来倒也没有落后他什么进度。 “装的不是dows系统吗?”唐璜还想着运行的同时自己能玩玩游戏呢,没想到孟繁岐直接就没有安装系统,而是装上了ubuntu 1204 lts。 “lux系列的系统要稳定很多,dows的话到时候要是一些环境之间起了冲突,有什么问题,那就麻烦大了。” ubuntu的年份04 lts系列非常经典好用,甚至有一些公司直到22年还在使用ubuntu 1604 lts作为环境。是一个非常稳妥的选择。 “行了,数据和代码我基本上都备份进去了,你有空的时候慢慢从头学。不清楚的地方随时再来找我。”孟繁岐又配置了许久各种环境和包之后,时间也已经来到了晚上六点多。 由于前世曾一起合作过论文和小型竞赛,自己转向这个方向也受到唐璜影响。但要说一回来就劝人休学去转这个内容,孟繁岐确实也不知道怎么开这个口。 如今唐璜终究还是自己走上了这条道路,那他自然还是要拉兄弟一把。 况且根据前世经验来看,唐璜虽然在学术和创新等方面没什么天分,但工程实践和参数调优的部分,倒也算是直觉上佳。 如今自己的论文草稿已经逐渐成型了不少篇,囤积了不少实验要跑,许多实验的参数调整和优化,这种苦力活有个人帮忙确实能够轻松不少。 自从了解到孟繁岐如今在做的事情之后,唐璜便跟着恶补了不少对应的知识。 要说有什么地方始终想不明白,那就是ai模型对输入和输出的这一转换过程。 按照付院长的数学理解,深度模型的本质是使用一种非常复杂的高维函数,对某一具体的任务或者规律进行近似的表达。 而模型训练的过程,就是根据各个变量的函数输出值,逐渐求解该函数的过程。 “所以说人类的某些任务需求又或者说规律,其实是很复杂的函数,远比一些简洁的物理定理要难。只是猫与狗,人类就已经难以总结出一些说得清的必正确的法则。 即便说得清,如果我继续扩大问题到猫科,犬科。或者继续扩大问题,到我们这一次的一千类分类,人还能说得清,根据一千多万张图片总结出准确的规律吗?” 唐璜想来想去,别说让他总结一千个类别如何准确区分的规律,他恐怕都背不全一千个类是哪一千个。很难想象孟繁岐让他看的alex已经可以在千分类上做到如此高的准确率。 “你知道吗,不管是猫还是狗,它们基本上都无法通过‘镜子测试’。也就是说,它们无法察觉到镜子里的生物是自己。”唐璜突然有些感慨, “我现在感觉,人类无法理解ai总结出的规律的样子,就像是通不过镜子测试的动物。总想探着头往镜子后面看,但可能根本就没有看对方向。” 第13章 开赛在即 13年的夏天,燕京电力大学本学期已经将近尾声。 大部分学生的课程都已经结束,除了少数还没有考完的科目,平时基本上已经无所事事。 就在大部分学生颓废地在宿舍哀嚎为什么学校还不装空调的时候,有两个人正干劲十足,在为两个月后开始的竞赛做准备。 两人已经畅聊了不少,孟繁岐大概为其梳理清楚了基本的概念和认识。 他一直认为,新人接触ai和人工智能,切忌执着于某个局部和概念,容易得不偿失,看了半天还没看懂。 先对整体的原理用浅显的方式,结合生活中常见的场景和概念去理解为好。 随后则先接触一个可以顺利运行的代码例子,跑起一个测试版来,会大大增强自己的自信心,有很强的成就感。 有了兴趣,有了成就感,有了信心,又大概理解了整体的流程和意义。人自然会自发地去探索代码,尝试去理解每个零部件,每个参数的意义和它会产生的影响。 说不定就会有一些奇思妙想。 如此从上而下,方为正道。而不是苦苦啃了几个月的公式,结果来到电脑前一句代码都不会写,根本无从下手。 前段时间,孟繁岐已经将基于阿里克斯的cuda-nv框架,实现了一个简易版三层神经网络做十分类任务的玩具级版本。 唐璜借此基本熟悉了本次竞赛的第一个任务内容。 孟繁岐便指使他去仔细看一看ia官方给的数据存放方式,开发工具和使用的方法。 自己则尝试将自己这段时间以来所准备的算法基于该框架实现,但是不太顺利。 其实阿里克斯自己在主页上也意识到了这个问题,他称自己主页对代码的描述是非常不充分的。 而此时非常不完善的生态也进一步地加剧了这个问题,英伟达的cuda起步不算太久,不同版本之间的代码又需要改动。 孟繁岐更换了几个代码库的版本,结果显卡gtx-690的驱动似乎有哪里不兼容,部分代码的编译也不顺利。他相信这份代码本身是阿里克斯发布出来的比较成熟的版本,不会有什么问题。只是环境和调试上确实是一件麻烦事。 此时的ai技术不能说是小众,但也没有到这种细节问题都随处可查的地步。孟繁岐浏览了一下相关的技术网站,查看了一些相关讨论。 虽然解决了大部分问题,但终究还是剩下了一些。 “没办法了,只能写邮件给阿里克斯求助一下。”孟繁岐倒不是很担心阿里克斯愿不愿意回复的问题,只要自己表明来意,说清楚自己希望以深度神经网络参赛ia-2013,阿里克斯是一定愿意伸出自己的援手的。 众所周知,ai三巨头是辛顿,立昆(lecun)和本吉奥(bengio)三人。2018年的图灵奖由这三人共同获得,以表彰他们多年来的坚持和贡献。 新时代的ai起飞靠得核心技术是深度神经网络,但在60和80年代的两次热潮之余,神经网络其实并没有得到足够的重视。 阿里克斯是辛顿的学生,2012年两人和师门其他人一起以alex参赛ia-2012的时候,是唯一一个使用神经网络的团队。 孟繁岐很清楚,辛顿和阿里克斯渴望神经网络被发扬光大,他们也已经在2012年以碾压的姿态击败了其他竞争者。 此时的他们还没有完全开始日后非常忙碌的事业,正处于“万国来朝”的喜悦之中。非常乐意为非盈利性质的同好提供技术上的支持。 阿里克斯主页上开源的这套cuda-nv其实就是日后tf和pytorch的缩影。 贾扬清博士后来开发的caffe是许多ai开发者的初恋,很多内容也是基于cuda-nv。贾博士本人也与阿里克斯交流甚多,从阿里克斯那里得到了很多的帮助和支持。 时隔多年,贾博士仍曾感怀阿里克斯和cuda-nv,说明阿里克斯在ai技术方面,确实是一个热情好客的人。 虽然决定写邮件叨扰,但其中内容却不是那么容易写的。程序员是一种对提问质量有较高要求的群体,尤其是阿里克斯这样走在时代前沿的顶级大脑,这样的人对愚蠢和傲慢的容忍程度是很低的。 因为开源(open-urce)是这个世界的一大特色,ai的飞速崛起很大程度上依赖这种无私分享的氛围。去年夺冠击败一众一流大学和科技公司的alex,其所有代码很快就已经可以被随便一个人直接下载到自己的电脑上。 没有任何的壁垒和门槛,最核心的内容就这么摆放在你的面前。在这样的情况下,如果再问出愚蠢的问题,是显得有些侮辱人的。 那些不愿思考、或者在发问前不做他们该做的事的人。那些人是时间杀手——他们只想索取,从不付出,消耗我们可用在更有趣的问题,或更值得回答的人身上的时间。 “拿来。”“给我。”他们的问题听起来就是这个意思。 阿里克斯为许多人提供帮助使用的是自己私人的时间,第一次直接接触业界的风云人物,孟繁岐可不想显得很不礼貌,像个傻子。况且,草率的问题其实也只能得到草率的答案。 如果一个人不能详尽,清晰而有逻辑地把自己的问题描述清楚,想必他也是没有什么可能得到自己想要的回答的。大多数人在求助的时候总是专注于描述自己的感受,但实际上并没有人在乎。 以求图求出处举例。“啊啊啊啊!!!急急急!!我要爆了!!”和“日漫,有彩页,是个短篇,一共三个角色,画风有点像xx和xx。” 这两种描述哪个更有可能得到可靠的回答,想必不需要过多的解释。 还有一个很经典的起手式,是“在吗?”。如果看到这样的问题,快跑,头也不要回,后面准没好事。 打开邮箱,孟繁岐详尽地描述了自己的相关硬件型号,驱动版本,环境和库的版本,具体出错位置,报错的日志,自己已经做过的搜索和尝试过的办法以及它们的结果。 点击发送。 “现在加州时间应该是凌晨,天还没亮。”孟繁岐算了算时差,自己得到回复最早也是明天了。 此时最要紧的事情是先基于阿里克斯的框架做修改把15年的名震天下的res实现出来,等问题解决后进行调试。 不仅是代码和实验结果,他还需要尽早基于新的深度神经网络把对抗生成算法的实验完成。 孟繁岐很清楚,几个月后赛事结果公布的时候,自己基于后世kaig残差思想的drea一定会引起很大的轰动,得到相当大的关注度。 而到那时,孟繁岐则要借助这个难得的机会,将对抗生成算法一举推出。 先用基于残差的drea吊足所有人的胃口,在所有人都渴望知道drea技术细节的时候,公布基于drea的对抗生成网络的具体技术细节和实验结果。 得不到的才更想要,不是吗? 第14章 万事俱备 “妈,今年我就不回去了,顺利的话明年年初回去看望你们。” “我不是在外面瞎玩,休学也不是退学,您二位别紧张哈,我知道我在做什么。” “也不用给我打钱,我也不是在创业,只是这段时间需要集中精力解决一些问题。就今年底,您放心,就今年底。如果不成功,您说什么我都听您的。” “好,好嘞,记得叫老爸多出去运动,你们注意身体哈!” “回,回去。过年的时候一定回去。” 挂了电话,孟繁岐靠在墙上,长长地叹了一口气。 这些事情实在跟父母解释不清楚,若不是因为担心付院长会出手相助,他原本是不打算去办休学的。 现在父母了解到如今的情况,肯定是忧心忡忡。最近几次通话,不管自己怎么说,父母总是没法放下心来。 孟繁岐只能靠着年底的期限安抚他们一下,承诺只要今年不能取得杰出的成果,就什么都听他们的。 看着房间里幸灾乐祸在调参的唐璜,孟繁岐没好气道,“笑什么笑。” 唐璜瞬间做出一个严肃认真的表情,但不论怎么看都带着三分阴阳怪气的感觉,让人很是不爽。 ------------------------ 这天的迟些时候,孟繁岐收到了阿里克斯的回复,看了眼时间点,阿里克斯应该是一起床就回复了邮件,可以说是相当勤奋了。 这个时间点已近临近今年赛事快要开始的时刻,不过阿里克斯本人其实没有计划继续组队参与本次的赛事。 只是哥虽然不在江湖,江湖却到处都是哥的传说。 13年的微软研究院队伍,新加坡国立大学队伍,和贾扬清领衔的decaf,uc伯克利等队伍,都深受阿里克斯去年思想的影响。 根据阿里克斯介绍的办法,孟繁岐很快调试完成,顺利将批归一化,ada优化器等操作从自己实验的环境迁移到cuda-nv框架上,做了一些调整和适配。 没过过久,便已经在cifar-10上运行了起来。 接下来便是本次参赛的最核心竞争力,残差网络在这个框架上的实现。 “今年的ia挑战赛其实没有什么太多的新想法,大家基本上都是以复现阿里克斯的算法为主。” 孟繁岐当然不准备和其他队伍一样,基于阿里克斯的框架去重新实现阿里克斯去年的参赛算法,早期的许多算法在参数量和计算量上都有很大的冗余。 “谷歌的google和牛津的vgg原本要明年才能研究出来,不过我今年参赛之后,这两个ai历史上的重要网络恐怕就要胎死腹中了?” 别说是现在了,截止到14年末,多余的设计仍旧大量存在与谷歌和牛津大学的算法当中。 直到15年,那个男人以残差网络res夺冠ia-2015,铸就了深度学习时代的ai模型的神格。 残差思想是孟繁岐此时此刻的最佳选择,一方面它会成为深度学习时代的里程碑,因为它的核心思想,就是如何把深度网络做得更加‘深’。 另一方面,它的实现和结构简洁,抛弃了大量人类看来很有道理和价值,但实际上其实用处不大的设计。 将简洁好用的结构反复重复,这也大大地降低了孟繁岐所需要的开发工程量。 alex是八层的结构,各自有一些独立的设计,在此时,8层已经是革命性的深度网络了。 更深的网络特别难以训练,因此原本直到14年,谷歌和牛津才分别把这个深度推进到22层和19层。 而res的思想,彻底从根本上解决了网络变深就没法顺利训练的问题。它让50,100,150,甚至1000层网络的训练成为可能。 “从去年的8,到今年的100+层,甚至1000层也可以训练。在2013年的视角来看,这一剂猛药应该够劲了。” 不仅是深度上取得了开创性的突破,res的性能也同样惊人。它是第一个-5错误率低于人类能力的结构,单模型达到了46左右。 如果综合几个不同方式训练的res,平均他们的输出再去预测的话,其-5错误率甚至低至37。 “其实在ia上做得太准了反而是一件怪事。”考虑到后世的研究中,该数据集中的标签其实有不小的比例是错误的,越贴近百分之百的准确率反而越有一些荒诞的感觉。 res的res指residual,正经点说是残差,说得明白一些是一种短路或者是跳跃链接。 再说的浅显一点,假设原本的操作为f(x),res就是把计算过程从f(x)改为f(x)+x。 这也是孟繁岐最早与付院长讨论的内容之一。 这种不带任何参数的支路链接,直接把操作前的内容加到操作后的内容上,是深度网络突然能够在上千层的深度下收敛的秘密所在。 在此之后的几乎所有ai文章,都很难绕得开这个思路。恺明本人单就这一篇文章,就在六七年的时间内收获了十五六万的文章引用。 不得不说这是一个天文数字。要知道即便是nature cell science三大世界级顶刊常客,着名华国美国双料科学院士抽出一个来,至今为止所有文章的总引用数量加在一起五万多都算是多的了。 当然了,单以论文被引用的次数来评价文章的水平和作者的水平是有失偏颇的。 很多基本学科曲高和寡,看得人少写得人也少。引用自然就上不去。 但就ai这个实用性实验性比较强的学科来说,内部去对比的话,引用的多少含金量还是相当之高的。 大家只会用代码投票,有价值的东西会一直迭代下去。有利于自己模型在任务上性能提升的技术,则会被一直引用下去。 学术界一直有这样的说法,搞理论的和搞实验的两边相互看不起。这倒也不是无中生有。 恺明凭借几篇代表作奠定自己历史地位后,就总有个别人喜欢说什么“res的思想早就有人提过了”,“几十年前的东西不算什么新东西”,“这篇文章也就是流量大罢了,和流量明星是一样的”。 酸味都要溢出屏幕了。 孟繁岐不是没读过一些理论类的文章,但他个人觉得新时代的ai,p话谁都会说,代码写出来才是本事。你说几十年前就有的东西,怎么不写一个res突破人类水准呢? res的核心代码难写吗?不难的。 基于阿里克斯的框架,只需几个小时的时间,他就可以基本复现出res论文中的所有结构。 弱小和无知不是生存的障碍,傲慢才是。 第15章 比赛在开始前就已经结束 2013年的暑假,距离比赛开始时间还有大约一个月的时间。 “模型的训练过程需要将所有的权重,数据和许多中间过程都放入gpu中进行处理。因而gpu的显存大小格外重要。”孟繁岐叹了口气,“即便是我们购买的旗舰690,也太小了,只有4g大小。” 比起后来被美国禁止卖给华国的a100-80g,690不说其他性能,单显存就少了20倍。孟繁岐如今只能可怜巴巴地每次使用16张图片对模型进行迭代。 “一次十六张,一次循环要接近一百万次才能更新完整个数据集。而想把模型收敛好,上百次循环又是少不了的。” 孟繁岐估算了一下,这个版本出一次结果要接近20天,最后的训练过程确实大概消耗了三周左右以收敛到现在的这个性能。 好在ia在后来基本成为了每个算法工程师必调参的练手数据集,孟繁岐自己就曾无数次刷榜,自然是轻车熟路,清楚各类参数的大概设置。 这为他至少节省了一两个月的珍贵时间。 即便一次训练需要三周之久,孟繁岐却仍旧赶在比赛开始之前就已经准备好了一版模型。 看着训练出来的模型最终性能达到了预期,孟繁岐心中的一块大石总算落地了。 这几个月来,他唯一担心的一件事情就是多年前的老框架会出一些他意料之外的问题,导致最终的结果不能和理论预期吻合。 一旦这种事情发生,找到问题所在并测试解决的代价就太大了。倘若不能够及时解决,会很大影响到他初期的规划。 眼下的结果大约在49的-5错误率,这个版本比后世论文中的性能要稍差了一丁点,但好在仍旧强于赛事方给出的人类标准了。 一般来说,比赛前是不会公布比赛所使用的具体数据的。只是ia比赛比较特殊,一千多万量级的图片,总不可能办一两次比赛就舍弃掉,不再使用。 因而每届比赛所用的数据是变化很小的,只是具体赛道,所竞争的内容和评判的方式常会有所调整。 虽说ia休赛的时期其实也可以提交结果,孟繁岐现在就可以把这个结果上传上去,夺取第一的位置,但关注度毕竟不可与赛时的激烈竞争同日而语。 与此同时,唐璜也终于开始意识到事情的走向已经远远偏离了他的预料。 “我记得之前查到alex在这上面的准确率不到85,你现在这个已经特么超过95了啊。”唐璜第一次来查看结果的时候完全不敢相信这个事实。 “你确定没搞错?别忽悠兄弟啊。兄弟书读的少,很容易被骗的。”唐璜此刻的心态很复杂,很希望这是真的,但由于事情实在显得太美好,反而很难相信。 “是假的,我骗你的。”孟繁岐翻了个白眼,“我加了特技,里面都是化学的成分。” “不会,我亲眼看这性能一路上收敛上来的。”唐璜又翻了翻模型训练的日志,声音之中带了三分委屈。他刚刚已经在脑补自己抱紧大腿,走上人生巅峰的场景了。 这就是患得患失的可怜人啊,不敢相信,却又害怕是假的。 “虽然我没有测试集的真实答案,但是我从训练集里划了百分之5出来没有使用,作为验证的办法。”孟繁岐对这个数据集的方差可以说是了然于胸,95的数据用于训练,5的数据用于测试已经是相当稳妥而保守的比例了。 “也就是说,只要这百分之5的数据和测试集的数据差别不大,你的办法可以比去年的冠军强十个百分点?”唐璜仍旧还处于极度的震撼当中。“就这么简单?我还没出力呢,你们就全趴下了?” 唐璜此时的感觉,就像是夜神月第一次发现原来可以直接指派死神去除掉自己最大的对手l一样。想象中的努力,拼搏和奋斗一样都没有发生,也完全没有必要,惊人的成绩和进展甚至在比赛正式开始之前就已经获得。 “这就是人生。成功与失败很多时候可能与你并无关系,习惯就好。”孟繁岐拍了拍他的肩膀,“这次不习惯也没什么,以后的道路还有很长很长,你会习惯的。” 因为不习惯也没办法,是。改变不了体重的人就只能改变审美。 否则会被自己折磨一辈子的。 既然在95的数据上已经取得了这样的结果,接下来要做的就是把余下的5也加入进去,继续微调模型几天。 如此一来,得出的最终结果就可以直接在11月份的时候做提交所用了。 在一个性能已经相当不错的模型上继续微调它的性能,就远远用不到21天那么久的时间了。 只需两天左右的时间,新的训练日志便显示,模型的性能已经基本收敛到一个固定值,很少再继续波动。 这样的话,孟繁岐在前往澳大利亚会议现场之前,就只剩下唯一的一件事情要做,那就是补齐手头这些论文的实验数据。 将这些文章所缺的最后一块拼图填补上去。 截止此时,孟繁岐已经大约完成了接近7篇之多的文章。除了本次的参赛核心,基于残差思想的新模型drea,以及相关的训练技巧,批归一化,ada二阶优化器,和ix-up数据增强之外。 孟繁岐还在三个其他方向上准备了开创性的工作,以占坑三个关键的领域。 在参赛的相关内容中,其实只有残差网络算得上是开创性的内容。余下的三者,虽然是各自方向上的佳作,但是难以称得上是某一细分领域的奠基之作。 写论文去详细描述,也只是迫于无奈,因为为了确保drea的性能和训练速度,孟繁岐不得已而使用了一些技巧。 为了确保这样的重要结果业界可以复现,孟繁岐不得不详细描述这些训练技巧,于是便写成论文。但若是有得选择,其实并不急于一时。 而他真正希望抢占先机去布局的,一,是先前与付院长讨论过原理的,生成式对抗网络。这是近些年来最具有前景也最优雅的无标签学习方法,是以后所有生成类技术难以绕开的一个里程碑。 二,是基于新思想的实时检测网络。这会使得在图片上分辨物体并确定位置的速度和准确率大大提高。日后落地最广的图像检测技术,不论是人脸识别,自动驾驶还是工业内检测。这些新技术都不得不提到这次提速的重要意义。 三,则是最简洁好用的分割网络,u-。这将会是复杂分割任务的基准线,并且会制霸医疗图像领域。 孟繁岐选出这三类加上残差网络,就涵盖了分类,检测,分割和生成四大领域。占领了图像算法的四大主要赛道。 之所以全选择图像类的技术,也是为了显得合理一些。至于语言类,语音类或者多种模态的融合算法,他则计划可以稍稍放缓些时日提出。 第16章 署名 2013年的8月底,已经有学生陆陆续续在返校的途中。 欢乐的时光总是短暂,将近两个月的假期,似乎只是一转眼,就已经余额不足需要充值。 实验,竞赛,论文都一帆风顺的孟繁岐这个暑假仍旧十分忙碌。 只是这段时间都以自己在出租屋内埋头苦干为主,没有再去找过付院长。 一是因为暑假毕竟还是假期,虽然孟繁岐也很清楚,对于付院长这样有行政工作,又自我要求较高,比较专注于学术本身的教授来说。假期这种东西,肯定是视若无物的,多半在数院的院长办公室里还是可以看到这个忙碌的身影。 二是因为,自己确实也有些不想面对。 付院长在学术的问题上,颇有古风。不分辈分大小,也不在意对方的资历和身份。 因而初次相识的时候,甚至连自己的姓名都没有问询。 这也就导致了上回,付院长突然问到自己情况的时候,显得格外的突兀。 毕竟也相处且交流过多次,孟繁岐当时便猜到,付院长是起了爱才之心,想为自己解决专业的问题。 虽然惧怕麻烦到父母那边,孟繁岐还是很快地去办妥了休学。 一方面自然是不想影响到付院长自己的升迁,另一方面,其实更多的是因为孟繁岐已经规划好了未来几年的发展路线。 要想弥补自己在ai和计算机相关领域的短板,即便是重生一回,也还是有许多知识和课程要恶补。 如今这个学校其实已经没有什么读的必要了,此次休学,孟繁岐本就不打算再复学,他另有打算。 ia竞赛是一个世界一流高校云集的平台,本次赛后,孟繁岐有信心以谷歌为首的科技巨头会找上门来。 借助谷歌的平台和资源,这对自己早期奠定诸多方向历史地位是极其有益的,甚至可以说是最佳选择。 而若如此做,今后便必须在美国就读了。 孟繁岐并不打算效仿比尔盖茨退学创业的那一套,在他看来,这样的生活未免太累了一些。自己既然要发那么多论文,该拿的学位怎么可以不拿。 全美的诸多选项当中,斯坦福是目前孟繁岐最心仪的选择。 在他如今的视角之下,斯坦福的综合条件可以说是冠绝全美。 首先,从学科水平上,斯坦福的计算机,机械和it是全美前三,甚至可以说一句第一名的水平,符合自己的方向以及日后的就业创业计划。 其次,斯坦福就在硅谷旁边,不仅让自己可以兼顾学业和早期在谷歌的研究工作。附近数不胜数的科技创新企业,爱创业的斯坦福校友,这些对他以后诸多算法的应用,传播和销售来说,都是很珍贵的韭菜。 还有一条,那便是斯坦福是同时也是本次赛事的主办方,学风崇尚自由。符合他的需求,也最能理解他算法的价值,有很大概率会愿意接受自己入学。 既然已经有了这样的打算,孟繁岐觉得自己很难去回答和面对付院长的好意。 既已经受过不少的帮助和指点,他不知道该怎么开口谢绝付院长的帮助,告诉他自己已经准备离开这所学校。 突然之间,孟繁岐觉得付院长有些像自己的父辈。 燕京电力大学并不是什么计算机强校,因而他从未想到过,自己回来后会在这里得到如此关键有力的帮助。 相处时间虽短,相谈的内容也绝少涉及学术外的内容。但如此淡泊之交,反而使得关系更加纯粹无暇。 时隔几周不见,付院长的办公室似乎没什么变化。 见到孟繁岐之后,这段时间发生的事情他什么也没提。 “怎么样,最近又有什么新的奇思妙想?” 一切如常,这让孟繁岐大大松了一口气。 “最近没有继续再做什么研究,只是尽力将之前跟您讨论过的东西都仔细整理打磨了一下。实验也都基本做完了,结果和预期基本完全一致。出现的一些情况也如您预测的那样。” ai毕竟还是一个比较偏重实践的学科,理论再好,受众不可避免会窄很多。难以引起重视,毕竟有很多ai界的人看论文就先只看结果中的一两个数字。 “这段时间主要就是把这些内容正式写成了论文,所以耽误了不少时间。” “看你拿着那么厚的一沓纸,早也能猜到个差不多了。”付院长笑道,“在这一点上,我还是很欣赏你的。” “有好的想法,先仔细弄懂弄透,而不是急着就要把论文写出来投出去。好的东西更需要仔细斟酌,不要草草地就把上好的原料给雕次了。” 孟繁岐听了老脸一红,自己不急着写完全是因为准备等到有关注度之后再发,没想到还因此被表扬一番,实在惭愧。 “您给稍微看看,方便的话指点一下。” “怎么这么多?”付院长接纸入手,顿感一沉,估了估厚度,“这起码得要百来张纸了。” 这段时间来,孟繁岐与付院长所探讨和研究过的东西分布在诸多方向中,都是他不够明白的部分。 因而付院长所知道的只是全部内容中的一小半,现在突然看到这么多,难免诧异。 付院长毕竟不是这方面的专业,在他看来,这些问题还是有诸多共同之处的,却是万万没想到竟然被写成了如此多篇论文。 再细看装订,这得将近十篇了。 “细节的部分都请教过您了,不必细看。这次就是把成稿带来,让您大概扫一眼把把关。毕竟有不少写了您的名字在上面,还是需要正式请您确认。” 孟繁岐正说着的时候,付院长也已经看到,其中上面的三四篇文章添加了自己的名字在作者栏。 “我一个数学系的教授,又不是你的导师,加这个名做什么。”付院长明白孟繁岐的心意,若是些破烂水文,加他的名字自然是为了蹭他院士大弟子的声望。 但孟繁岐的这几篇论文的水准他大概还是知晓的。 即便因为专业不对口,大大低估了这几篇文章会起到的恐怖影响。单论文章本身的质量,也已经是上佳之作。 莫说他教过的研究生博士生,就算是算上他的同门,算上他自己。那也找不出谁能在这么短的时间内,就可以把计算机视觉这样一个大领域内的主流任务统统翻新一遍的。 第17章 记得回来 付院长快速扫完了最上面带了自己名字的两篇文章,心中无比的震惊。 他原本以为,自己应该是这个世界上最不会低估他的人了,却仍旧没有想到,自己还是小看了他太多。 “我们搞基础学科的,就是容易跟不上时代。”付院长摘下自己的眼镜,捏了捏自己的眉头,又重新戴了回去,非常郑重地看着孟繁岐。 “纸上得来终觉浅,不管是理论上推衍地多么详细准确,还是会对技术的实际价值和作用有很大的误判呐。” “我在跟你梳理这些内容的时候,虽然觉得有些意思,但实在也想不到会比世界级的记录还要高出那么多。” 付院长不大了解具体的细节,即便先前讨论的时候告诉他这个结果,他也不会有什么太大的反应,因为没有具体的对比,也就无法真的体会到这些技术的意义。 而今在正式的论文当中,各种图表一应具备,不管是性能,速度还是稳定性。多个指标的对比图表上,属于孟繁岐的图案全都是异军突起,鹤立鸡群。 “这名字我不能加。”付院长快速浏览了余下的两篇,心中很是明白孟繁岐这么做的意思。 付院长心想,他知道如果全部的文章都署上我的名字,我是说什么都不会答应的。于是便挑选了其中最为重要,最有价值的几篇。 如此一来,自己便更不能接受了。 “我付德清虽然没有像老师那样,在最顶级的学府教书,但自问也还有些才华。这些年来,受过我指点,得过我帮助的学生与同仁不计其数,这种程度的交流还远远谈不上要署名的程度。” “况且,这个领域我本就涉及不深,这次看到成稿,更加清楚我们谈论过的也只是其中一小部分。这个名我如果署了,岂不就和大学里那些整天抢占学生成果,夺取一作身份的学术臭虫一样了吗?” “您言重了,这是哪里的话。”孟繁岐听到付院长这么说,吓了一跳,连忙摆手道,“您愿意署名是帮了我大忙,否则我孤零零一个本科生在上面,说不定人都不愿意看我的文章。” “要么这样您看如何,我有两篇这个月可能就要先后公布,我现在一个普通本科生,也没有导师指导,您就是我的导师,先署名在上面。帮我撑一下场面。” “后面呢,我有了一些基础,有了一些关注,或许可能有机构支持。到那时候就不麻烦您,怎么样?” 付院长一听就笑了,这小子明明知道这些成果的水平,偏偏说得像是这些文章会无人问津一般。 “明明就是要送成果与我分享,偏偏却又说得像是我帮了天大的忙。我说你有这些小心思小心机,再多分一些去该用功的地方,这该多好?” “你这小子虽说学术的品味和视野很好,但数学这种最底层的东西还是有所欠缺,可得要好好补一补。不管去到哪里,最基础的功夫打好点总是没错的。” 付院长心中叹了一口气,他甚至还曾想过,趁着自己的老师还没退休,过两年把这小子推荐去鄂院士那里去读研究生。 可从这几篇论文看来,他在计算机视觉方面的造诣已经远超了自己的想象。纵使自己推荐他去院士门下读应用数学,也可以说是大大的舍近求远了。 这才刚跟鄂院士提了一次,就不得不打消注意了。上次为他问询专业的事情也是如此,刚和曹主任提了一嘴,便没有后文了。 付院长将这件事压在了心底,如今看来,这小子是有自己的打算。 他很有主见,也很有能力,做的几个打算甚至远比自己想去铺的那些路要好。 “等到真的有了出息,可要记得回来。”看到这么多细致老道的英文论文,付院长哪里还不明白他的打算?“目前这个方向,确实要数国外的氛围和条件更好。” 孟繁岐闻言,顿时明白付院长已经猜到了自己的计划,“ai和人工智能是新的方向,但是发展速度太快,规模也太大。这样快速的变革,大学这样的机构在未来很难支撑起相应的设备和师资。” “有能力获取大量数据,又有海量计算能力去研究算法,支持大规模应用的,只有世界顶尖的科技巨头。” 平心而论,根据后世的经验和经历。 华国的大型企业大多更难沉下心去投资真正不盈利的算法研究。 像谷歌和openai做的那些东西,其实不是什么特别高深有壁垒的技术。 只是埋头去做那些研究和尝试烧钱太多而没有收益。 华国的不少科技公司,往往在技术的早期和雏形阶段,就总是急着落地,让它们成为变现的手段。 这种相比之下缺乏耐心的总体策略,是很不利于自己早期研发技术和中期落地超越人类的诸多项目的。 “听你的意思,已经选定了去处?”付院长饶有兴趣地问道。 “我的首选是斯坦福,次选是uc伯克利大学。”孟繁岐也不扭捏,直接答道。“这两所大学是硅谷附近最好的院校,更方便我和业界接触。” “需要我找斯坦福待过的朋友给你写推荐信吗?”大二结束休学,中途想进斯坦福可不是那么容易的事情,虽然不知道孟繁岐打算怎么打动这所世界顶级的名校,但付院长不知怎么的就觉得这完全不是一个问题。 不过还是这么一问,如果需要的话,他自然愿意提供力所能及的帮助。 “这件事就不麻烦您了,您就等我的好消息。”孟繁岐咧嘴笑道,年底这次会议,他有信心搞到好几封业界大佬的推荐信。 对一个本科生来说的话,这个力度不说是后无来者,也绝对是前无古人了。 “至于给您署名,其实更多的是出于一种象征的意味。”孟繁岐把话题又绕了回来,“我只是想做一个记录或者象征。我这条道路的第一步第二步,是在您的大力支持和指导之下迈出去的。” “哈哈哈。”付院长闻言大笑,用手指虚点了孟繁岐几下,心中甚是宽慰。 “你小子都这么说了,我再继续推脱,岂不是不知好歹了?却之不恭,但只此一次,下不为例。” 第18章 结果提交 一般来说,比较成熟的竞赛榜单分为两种,一种是公共榜单,一种是最后的私有榜单。 对应的数据也不相同,分为验证集和测试集。 这两部分数据的真实答案都不会公布出去,但在参赛者提交结果之后,公共榜单只会公布验证集部分的结果供大家参考,而不会公布最终测试集上的结果和内容。 这是因为实时的榜单排名只是为了帮助大家理解自己的算法大概在什么水平,和最强的算法差了多少。虽然没有直接提供答案,但是如果参赛者调整设置反复提交结果,还是可以一定程度上分析到这部分数据的内容和分布的。 故而,这部分数据只做参考之用,最终决定排名的只有测试集的那部分。因此赛事的公共榜单只能一定程度上反应问题,没法百分之百地表示最终的名次。 “虽说有的赛时榜单根本不用于最后的排名,但人们却很容易被这种榜单的魔力所吸引。”孟繁岐想起后世和唐璜参加过两次小型比赛,不知道为什么整天就想盯着那个榜单使劲看。 自己的提交成绩高了一名,低了一名都会引起心情的巨大波动。 “什么行业都是这样的,你看什么小说行业,影视剧行业,明星行业。创造焦虑嘛。”唐璜不以为然,“没有焦虑就搞个榜单创造焦虑,人人都想当人上人,这榜单一出啊,就像是平静的水池里洒进了一把鱼饵。原本翻着肚皮不动弹的鱼就全活络起来了。” “体育圈也是,最爱说谁是goat(历史最强),什么詹姆斯pk科比,梅西对战c罗。”唐璜继续吐槽道,体育圈现在饱受这种风气所害,马上都快变成饭圈了,“统计的数据也越来越多越来越离谱,以前就统计一个进球,现在连哪个部位进的球也统计,我前几天还看到有人说c罗的弟弟进了一个球。” 孟繁岐在查看提交结果的信息,乍一听愣了一下,“c罗还有弟弟呢?” 仔细一想才回过味来,搞了半天是二弟。 其实11月11号,提交网站就已经被公布出来了,这一年的提交窗口期很短,也不像后来的很多竞赛那样分验证集,在赛时开放公共榜单提交。 11月13号,结果的提交就会截止。 不知不觉又是四五十天过去,孟繁岐反复打磨了几遍这几篇论文。 不仅如此,等到后来他发觉论文里的实验已经跑完,便将检测算法接在了已经训练了很久的分类模型上,又跑起了检测赛事的数据。 检测任务是分类任务的进阶,在你的程序分辨出这张图片的类别之后,更进一步的操作就是用矩形框把该物体的位置在图片中位置给圈出来。也就是后来大家熟悉的人脸上的框框。 再进一步就是分割了,不采用矩形框这样大的,规则的图形,而是像素级别地把某个物体的细致轮廓在图片上表示出来,也就是一种类似自动抠图的操作。 当然了,不论是检测还是分割,都是需要人工去标注训练集的原始答案的。 ia-2013的检测赛道数据集不算太大,一共接近40万张图片,共区分200类。这种进阶类型的数据,标注起来要辛苦很多,因此数据量和分类不可同日而语。 不过,相比2012年的5717张,区区一年的时间,已经是百倍的巨大飞跃了。 “没想到时间竟然会这么多。”孟繁岐记得这时候的检测大多数还是基于传统hog,lbp的办法,在13年的这个数据集上ap最高也就0225左右。 自己既然来得及完成论文上的实验,自然要抽空去降维打击一下这些老古董方法。 每个参赛队伍在各任务上有三次提交的机会,孟繁岐只需要一次就够了。 参与竞赛的队伍往往会训练好几个版本的模型,然后做一些排列组合的集成,分多次提交,以确保自己的结果不会被一些不稳定的因素影响。 这也是追求更高性能的一种办法,因为谁也无法保证自己的哪一次结果在位置的数据上性能最好。 有时候第一名和第二名,就差在毫厘之间,可能只是小数点后的两三位。 只是孟繁岐完全没有这个必要这么做。 余下的时间也来不及再做什么,孟繁岐本想11号就早早把结果提交,多一事不如少一事。 但唐璜却阻拦他,说英雄总要最后一步到场,才显得特别戏剧化。 “这提交也不是实时显示的,而是14号统一公布结果。”孟繁岐指出了这么一个尴尬的问题。 “额”唐璜只得强撑着解释道,“虽然其他人看不到,但主办方不是看得到嘛。在最后关头,给他们一点小小的中国震撼!” ------------------- 大洋彼岸,斯坦福大学的ai实验室sail成立于1963年首次神经网络的浪潮中。见证了ai的两次热潮和两次衰退。 如今,它由青年华裔科学家,ia的组织者李飞飞指导。 李飞飞09年开启ia项目时还在普林斯顿,她后来来到了斯坦福,升任终生教授,并于今年开始领导斯坦福的ai实验室。 接手这么一个有历史的实验室不是一件容易的事情,再加上今年的ia竞赛刚刚结束,李飞飞此刻相当的忙碌。 她昨天看了一眼新一年的成绩,意料之中。 今年没有看到什么特别开创性的论文,大家基本上还处于对alex的学习,和新赛道的摸索当中。 深度神经网络去年一枝独秀,力压群雄,但谁又能百分百的肯定这就是正确的道路呢? 即便是表现最好的模型也仍旧有11个点以上的-5错误率,而且通常来说,这个结果还可能是多个网络集成预测的,只是刷榜好用,这种方式并不具备实际的应用价值。李飞飞并不希望自己一手打造的ia成为刷子乐园。 路漫漫其修远兮。 就在此时,自己的电话突然响起,李飞飞拿起手机看了一眼,是邓嘉。 “holy shit,老师你快看赛事的验证结果。” 邓嘉的声音听起来非常激动,一上来就飚了一句shit。 “结果?什么结果。”李飞飞还不知道发生了什么事情,她昨天已经看过榜单了,大家的水平都差不多,今天又能统计出什么东西来? 眼下重新去链服务器不大方便,李飞飞便说“你直接截个图发我。” “嘟” 那边直接挂了,李飞飞微微颦眉,这小子今天是怎么了,平时不是这么毛毛躁躁的。 很快,两张图片传了过来。 李飞飞依次点开,霎时间,瞳孔微微放大,呼吸也不自觉地突然急促了起来。 只见两个榜单最上面的一行都是同一个队伍。 队名:drea。 提交描述只有一个字母不同:“a sgle drea”和“a sgle dreadet” 在一群集成了多个模型的提交中,sgle(单个的)一词显得格外惹眼。 第19章 这也太深了吧 “drea?这是什么网络结构?”李飞飞仔细翻找了一下各个队伍对自己提交的描述。 可以看到几乎所有队伍的提交中都描述道,“我们的结构基于alex”,“我们仿照alex”,“我们把alex和传统支持向量机\/\/相结合”。 做法类似,结果自然也大差不差。 剩下的便是如何把数个模型整合到一起的描述。 翻到队伍drea,人员构成栏只有“fanqi ng, huang tang”两个名字,没有具体的机构信息。 观看队伍算法的简介,更是寥寥数语。 “我们提出了新的drea,使得深达到百层乃至千层的网络能够被训练。由于缺乏足够的设备,我们只获得了单个的权重进行提交。” 孟繁岐是故意的,他当然可以把残差又或者是其他的主要trick简要地在队伍的提交描述里介绍清楚。但为什么要这么做呢,一定要先勾起业界这些人的好奇心,才能够获得最大的关注。 分类-5错误率,49。 这样一个简单的数字直接击中了李飞飞的内心。 算法的错误率低于人类的51,从09年她推动这个竞赛以来,一直是她追求的目标,也是她组织这个竞赛的一大原因。 她甚至曾经做好了打算,如果某一届的算法成功地突破了这个水准,就不再继续组织ia。 但她万万没有想到,这一天会来得这么快。 就在400天前,最好的传统办法还只能取得25左右的错误率。 去年alex 16左右的错误率,她以为是一次厚积薄发的飞跃,这样的进展可谓几十年一现。 完全没有想到今年的结果会给她一个更加夸张的惊喜。 drea,突破了人类水准的drea。 李飞飞觉得这个名字起得实在恰如其分,这个结果真是如梦似幻。 检测结果ap: 0,更是对第二名的0进行了降维打击。 我的天,这几个人到底是何方神圣?李飞飞苦思冥想,也想不出在哪个ai实验室有听过这几个名字。 “为什么不把算法内容大概描述一下!”李飞飞用手狂锤了两下桌子,没有任何人比她这个数据收集者更能明白和理解这个算法性能的含金量。 自从她看到这个结果的一瞬间开始,她的好奇心就如脱缰的野马,再也无法控制。真的好想知道,好想知道。哪怕只是似是而非的一两句描述,哪怕只是不明觉厉的一两个特定术语也好。 只可惜孟繁岐深谙媒体宣传那一套,字里行间,先是“我们提出了新的drea”表示这个结构是截然不同,相比alex变化很大的,以强化阅读者的好奇心。 随后又抛出重磅炸弹,“我们使得深达到百层乃至千层的网络能够被训练”,以去年8层的冠军来对比,这个数字实在太过震撼,更让技术从业者们心痒不已。 最后再假装谦虚一下,实则表示,我们只使用比较有限的资源,获得了一个结果,就不跟你们去卷多模型融合集成那一套了。 性能相差那么多,实在没必要呀。 “尽快把结果页面上线。”李飞飞回复消息给邓嘉,心中暗想难怪一想沉稳踏实的邓嘉刚刚冒失得很,“这个罪可不能让我一个人来受,我要让你们统统急得像热锅上的蚂蚁。” 最顶尖的大脑都是好奇心很强的,这种对未知的好奇,对更好的追求驱使着他们做出一个又一个可以改变人类生活的成果。 对稍稍近似一些的结果,可能还容易忍耐一些。因为会觉得,自己再仔细想想,努力测试一下,加入一点小的技巧,也许也可以收获同样的结果。 而一个比去年alex更加夸张的提升摆在眼前,即便是再自负的人都不得不承认,自己短时间内完全做不到这件事。 更大的差距反而让人生不起怀疑和嫉妒之心,只有更加纯粹的好奇和敬佩。 孟繁岐不准备改变大部分技术的名字,但唯独将混杂了一些其他方法如批归一化,二阶优化器等方法训练出来的残差网络结果称为drea。 一是因为重生十年一梦,自己回到2013提交残差网络就如同黄粱一梦,他其实偶尔都会担心,是不是这场梦随时都会醒来。 二是因为自己姓孟,与梦谐音。若要真取名ng提交,未免脸皮太厚了一些,绝无此必要。 赛事结果出来之后,同样觉得人生如梦似幻的还有唐璜和刘旭。 即便孟繁岐每次更新的代码和小技巧总能提升模型的性能又或者是训练速度,即便他们也无数次的在想,不会真的可以夺冠? 但从内心深处,他们都一直只是怀疑,从来没有真正相信过这件事。 也就更别提这种碾压的姿态夺冠了。 “微软,uc伯克利,圣彼得堡,ib,东大,新加坡国立,牛津,多伦多。”一路数下来,多少世界一流的大学和机构被远远甩在后面。 甚至于ai三巨头之一的立昆,本次也亲自带队参赛,但也只能折戟沉沙。 与此同时,就在李飞飞让邓嘉快些公布结果网页的同时,斯坦福大学附近硅谷山景城的谷歌公司里有三个人第一时间就关注到了这个结果。 他们就是去年的冠军,被谷歌重金收购的辛顿团队。 阿里克斯,高高瘦瘦,短发方脸。一身经典的程序员套装打扮,言行举止之间干脆利落,很有智慧和干练的感觉。 辛顿五官立体,稍有些鹰钩鼻,长相有三分像斯内普。面无表情的时候显得十分威严,让人心生畏惧,笑起来的时候却很有感染力。 不过此时此刻,他实在是笑不出来。 “难以置信,真的难以置信。”阿里克斯快步赶到老师的办公室门口,也顾不上敲门了,直接推门而入,“老师你看了吗?新一年的” 话还没有说完,辛顿就微微抬起右手示意他停下。 半晌,才缓缓将椅子转了过来,声音非常低而深沉地说道,“这特么也太深了。” 谷歌斥数千万巨资收购辛顿团队,可不是粉丝追星的行为。他们的合同当中,辛顿团队协助他们保持ai技术的领先地位是占了很大成分的。 这一次drea跨时代的提升,更高位置的十个点含金量远在去年自己团队的alex之上。加上又打破了人类水准,猛然之间给了辛顿数十年未有的巨大学术压力。 一年以来,他第一次有这种感叹,原来谷歌的钱拿着会这么烫手。 “他们到底是谁,有机会提前联系上吗?” 辛顿团队今年没有参赛也没有参与主办,自然也就没有队伍注册时留的邮箱和其他信息,如今这个震撼的结果出来之后,想要这个信息的人实在太多。 主办方不可能每个都给,也就不如干脆公正严明到底了。 而且辛顿了解李飞飞,她刚刚发消息让自己去查看榜单,就是故意想让自己好奇,怎么可能会提供协助? 倒是阿里克斯突然想起了什么,“前几个月好像有人给我发过邮件,署名就是ng,但我不确定他跟drea队伍有没有关系。” 第20章 纽约时报 “你们曾经交流过?”辛顿来了兴趣,他对这个来历神秘的drea队伍充满好奇。“如果能确认的话,不,你主动联络他一下,看看是否这个ng就是drea队伍中的那个ng。” “如果能够提前联系到他们的话,这对我们的处境将非常有利。” 如今,各大科技公司都开始逐渐布局ai相关的行业。自己团队年初加入了谷歌,而与自己同等地位的另一个ai巨头立昆,最近听说计划加入脸书。 对ai人才的争夺战大有愈演愈烈的味道,在其位谋其政,现在作为谷歌ai方向主要领导人之一的辛顿,在这件事上自然不甘落于人后。 “如果能在他参会揭晓自己的身份和联系方式前,就和他谈妥合作的条款,说服他加入谷歌的话。不说钱的问题的问题,至少可以大大减少很多沟通上和时间上的损耗。” 辛顿和阿里克斯回忆起自己几人最开始被招揽的那段时间,实在是挑花了眼。各家公司都伸出橄榄枝来,并且相互竞价,这导致自己几人需要反复去沟通议价。 虽然每次沟通就能涨个百来万美金的感觉真的很爽就是了,很麻烦,但自己几人还是乐在其中,数钱数到手抽筋,有时候做梦都在跟人谈判。 只是时过境迁,脑袋跟着屁股走。不到一年的时间,两人思考问题的角度和方式就完全变了一个模式。 “现在还有不到一个月的时间,我先跟他沟通确认一下。”阿里克斯觉得时间还算是充分,“如果可能的话,我尽量跟他约在会议开始前,争取能让公司提前跟他谈妥。” “这样很好,这次会议的话,我要亲自去一次澳大利亚。”辛顿的背受伤很严重,这些年来,他都很少坐下,更不适宜长途旅行。这也是他最终拒绝白度的一大原因。 “老师,您的背?”阿里克斯闻言有些担心。 “就冲着这个结果,值得我亲自走一趟。”辛顿摆了摆手,示意他不用担心,偶尔走一趟还是吃得消。现在的日子也没有那么紧巴巴了,头等舱躺一下问题不会太大。 “ai这个方向的人,多少还是卖我几分面子。”辛顿准备亲自前去,打的便是这个注意,很多原本犹豫要不要来的人,见到辛顿之后便不再犹豫。 “再说了,能这么快超车我们的方法如此之多的人,我也十分好奇,他到底是个什么样的人。” ------------- 榜单的结果出来后,孟繁岐一直在高强度冲浪,在外网检索有关ai和该竞赛的最新资讯和报道。 他如此关注相关的消息,倒不是为了满足自己的那点虚荣心,好,不只是为了那点虚荣心。 更多的成分是为了关注相关的评论和采访,看看现在这么早期就关注赛事和相关领域的企业和媒体有哪些。 找了两天后,没看到什么动静。孟繁岐本以为可能要等到赛事举办完成后才会看到大一点的媒体报道此事,却没想到今天纽约时报刊登了一则快讯。 题为《ai drea: a learng advance artificial tellince rivals huan abilities》也就是《ai梦,先进的ai技术已经可以与人类匹敌》。 孟繁岐看了眼这个标题,心里还是稍微有些不满。 drea的性能实际上是超过人类水平的,但纽约时报的标题使用的却是rivals,不仅表达的意思只是达到人类水平,其中还暗含了竞争对手的意味。 这与孟繁岐所希望的稍有出入。 不过对于纽约时报本身,孟繁岐还是非常满意的。该报成立已有接近两百年,并且发行地区并不单独限于美国本土。 其在世界各地都有发行,影响力还是较高的。 并且纽约时报整体的风格比较严肃而古典,完全没有最令人厌烦的新媒体震惊味。 《震惊!全体人类竟输给它?》《距离统治人类还有多远?ai已经超越人类!》 如果是这种风格的报道,看了想必也是专治低血压。 孟繁岐点开纽约时报的报道网页,一上来就看到了一个熟悉的名字,撰稿人马尔科夫。 此人在科技报道领域水平极高,从业已经40多年了。美国最早关注并报道互联网这一事物的人当中,就有马尔科夫。 孟繁岐之所以能够对他有些印象,主要还是因为很多硅谷大牛,例如乔布斯等人,都对马尔科夫非常信赖。 经常会给到他独家专访和独家消息,孟繁岐前世看过的不少新闻,例如谷歌无人车的消息,都是出自这位资深科技记者的报道。 “真是没有想到,这篇报道竟然是由他来亲自撰文。”孟繁岐啧啧称奇。 马尔科夫老爷子的措辞相当克制且严谨,“计算机研究者们近日取得了他们在ai技术上的新进展——ai技术已经可以在一小部分视觉相关的任务上展现出超过人类的能力。” “这项技术的突破和改进非常值得关注,因为所谓的计算机视觉系统已经在生活的诸多方面变得随处可见。这些新技术的突破来源于神经网络的规模增大和计算设备的发展。 神经网络可以被训练来识别人类的语音,检测图像中的物体,或者通过接触大量的例子来识别各种行为。 尽管这种网络是根据生物神经元的行为建模的,但它们目前还没有像人类那样快速学习新概念。不过在本次一年一度的学术机器视觉竞赛中,这种方式首次突破了人类的界限。 这项比赛被称为“ia大规模视觉识别挑战赛”,由学术、政府和企业实验室的研究人员组成的团队相互竞争,设计出既能分类又能检测物体的程序。今年,来自华国的一组研究人员赢得了该奖项。” “取得该成果的队伍名为“drea”,某种程度上,这也象征了人类一直以来对ai梦想的追求正在逐步实现。据悉,该赛事的正式会议和报告将在12月份与澳大利亚举行。” 全文很短,毕竟这只是一则快讯而不是整篇的报道,又或者是头版头条。 不过孟繁岐仍旧对此相当满意了,因为赛事的重头戏,最终的大会还没有举办。相关的科研人员还没有欢聚一堂,许多大佬是不会像自己一样急着去看榜单的。 只是榜单上的结果就已经能让纽约时报这样的大型媒体关注到这件事,还是相当难得的。 可能也是因为这个原因,总体的描述给人的感觉非常克制。孟繁岐再读了一遍,细细琢磨了一下文中的措辞,感到目前主流媒体对该技术的态度还是比较偏保守。 即便是如此关注和支持ai和新技术的马尔科夫,全文措辞都没有明显的积极偏向。 “看来这些算法对这个时间段的世界来说还是太早了。”孟繁岐关掉报道网页,微微摇了摇头。“步子跨太大,扯到蛋了。” 第21章 论文公开 许多学校都会有一句劝勉性质的格言,类似于“今天你以学校为荣,明天学校以你为傲”。 对大部分人来说,这只是一句鸡汤。但有少部分的人,可以真的做到把一己之力把学校的知名度打响。 论文也是如此,有些论文以刊登在顶级的期刊和会议为荣,而有些论文则是期刊和会议之所以成为顶级的原因。 对科研稍有了解的人,基本都会认为发好的论文就要发sci,发高分,一区的sci期刊。这种观点确实绝大部分时候都没有什么问题。 不过对计算机类,尤其是ai方向来说,其实会议比期刊要重要许多。 会议是一种每年定时收稿,定时审稿,然后把中稿的作者全都聚在一起交流展示的形式。他的特点是审稿快,时间固定有保障。并且参会可以和作者直接面对面交流讨论。 而期刊则是全年随时可以投稿,审稿时间不固定,也不会组织作者见面的传统形式。 对于很多学科来说,期刊更为权威,更加正式,审核也更加严格。 但对ai来说,期刊就显得太慢了。ai的速度太快,快到很多人没法等待。 比如去年alex夺冠,你13年初自己做了许多的研究,研究了四五个月,然后把稿子投了出去。如果你投的是会议,八九月份就已经宣布审稿结果了。 十一二月你就可以舒舒服服地去会场和别人谈笑风生,然后顺利毕业。 可如果你投的是期刊,可能半年的时间过去了还在审稿,这时候2013年的新结果一出来,审稿人一看,发现人家好像比你高了好几个点嘛。 原本可能可以中的文章,因此被拒也非常正常。 这时候真可以说是叫天天不应叫地地不灵了,运气好的转投差一些的会议和期刊,或许还能顺利。 运气如果不好,文章辗转被拒绝2-3次,从此彻底过时也很有可能,半年的心血就此白费,对很多学生来说可能就是延毕一年的结局。 由于这种独特而快速的学科节奏,ai方向重会议而轻期刊,往往是会议上取得成功,才会继续扩展文章的内容,投给期刊慢慢审稿。 如果领域内的学者想要了解最近的动态,基本上不大会去期刊查询,都会关注最顶级的几个学术会议,并参会直接和作者们交流。 期刊?刊出来的时候都已经是一年半前的技术了。时代变了,大人。 不过此时此刻,即便是会议对孟繁岐来说还是太慢了。ia的结果已经初步公布,他相信关注这件事的有心人都已经将目光锁定在drea和队伍drea上。 既然纽约时报都已经关注到了这件事情,那看来是时候发出生成式对抗网络为drea再加一把火了。 有的文章依赖高级别会议和期刊的名声为自己加持,而有的则不需要。 ai顶会cvpr的收稿截止日期是2013年11月1号,孟繁岐投稿之后,可以选择匿名将自己的投稿内容公开。 这样做是不违反规定的。 只是有些时候,这件事情根本是掩耳盗铃,脱裤子放屁罢了。 就比如现在的情况,孟繁岐准备公布自己的预印本,《基于drea的生成式对抗网络》。 即便他选择匿名,又有谁会不知道这篇文章的作者会是谁呢? drea现在的细节没有任何信息公布,除了他还能有谁做到在这个时候发布这篇基于drea的论文? 同理,后世ai技术逐渐向大模型发展,动辄几百上千块gpu。很多时候只看用了几张卡,用了谁家的独有大数据,看看内容就能猜到是哪家公司的哪个研究组了。 其他人想做也没那个资源,没那个能力。 既然是多此一举,孟繁岐自然不会做这样无聊的事情。 “此时此刻,我最怕的就是别人认不出我,又何必匿名呢?” 如此想着,孟繁岐便将这篇论文公布在了arxiv网站上。至于cvpr会议的人会不会觉得这样的做法违背了双盲审稿原则,就不在他在意的范围之内了。 arxiv是一个开放的学术预印本存储网站,是一种现代的分享研究成果的方式。 起初是因为某些基础学科审稿实在太久了,尤其是数学和物理,有的论文可能几个月都找不到人来读,根本没有人看得懂。 在这种情况下,许多人会考虑把一个比较草稿的版本,或者干脆就是最终版本直接放到arxiv这个公开平台上来。 这样可以促进交流和学科的发展速度,也是一种证明自己研究结果是何时得到的证据。 后来,计算机,统计,生物,经济等学科也逐渐加入,arxiv越来越包罗万象。 和正经的会议和期刊不同,arxiv只是一个开放平台。和pixiv这个插图分享网站一样。arxiv和pixiv基本上都不对上传的内容做非常严格的审查,因此上面的内容水平有高有低。 arxiv也不是一个正式的会议和期刊,其内容自然也不算真的发表。发布在上面的内容没有经过同行评审,有不被人承认的风险。 民科也大可以将自己的永动机大作发表在上面,装作一副高深莫测的样子。 别的不说,哄骗一下不知情的外行人还真有奇效。页面上论文简介,各种领域标签,还有引用方式都有模有样的,又全是英文。非科研人员乍一看到很容易上当。 不过孟繁岐丝毫不担心这件事情。现代ai的逻辑就是这么简单粗暴。 原理和代码就在这里,用相同的随机种子,任何人都可以复现我的结果。 别人承认不承认,质疑不质疑,孟繁岐完全不在意。 甚至,他隐隐有且期待,因为这种冲突会带来相当可观的关注度。 不多时,孟繁岐提交了生成式对抗网络的tex源文件,在网站上编译出了pdf文件。只待两天后,网站统一更新这些新增的文章。 与此同时,该论文的原作者伊恩(ian goodfellow)最近刚想到了这个点子的雏形,还处在思索的阶段,距离真正成型的生成-对抗框架还有着相当长的一段路程要走。 伊恩正在前往他博士导师,ai三巨头之一的——本吉奥,办公室的路上。 “这是一个绝妙的想法,我需要一些帮助。”伊恩如此想道,“我要在我博士的最后一年完成这个前所未有的绝佳工作。” 他决不会想到,有一篇更加完善,实验更加详尽,对相关领域的讨论和反思也更加全面的文章已经公布。 第22章 想法撞车 85年出生的伊恩最近几年的压力有点大。 对于一个普通的博士生来说,他其实并没有什么做的不好的地方,相反,他聪慧努力,也一直就读于名门。 本科,硕士均毕业于斯坦福,恩师是谷歌大脑的创办人吴恩达,博士就读于蒙特利尔,在ai三巨头之一的本吉奥指导下学习。 他的学业经历,个人智慧说是万里挑一也不为过,不过如果要与他的导师们去做对比,确实稍显暗淡了一些。 28岁的伊恩已经读到了自己博士的最后一年,数据的生成算法是他博士时期一直在思索的方向。 许多研究者们也已经在尝试使用神经网络去模拟人脑,来生成新的数据。 只可惜目前为止,这些数据通常存在很大的问题,完全无法使用。 并且一个很大的阻力是,生成出来的图像往往不可名状。这些无用的克系图像缺乏利用的手段,也不好去评估它们。 而前几日,ia上模型性能超越人类标准的结果让他有了新的灵感。 如果说,深度网络已经可以在一些图像类任务上达到人类水平的话,是否就可以避免生成式网络结果不好评判的问题,通过两个网络的相互对抗来完成这样的过程呢? 伊恩越想越觉得合理,他昨晚甚至没顾得上睡觉,而是直接花了一晚上的时间实现了一个生成-对抗的雏形版本,并尝试训练了一下,发现结果似乎和预期的基本一致。 按捺不住激动的心情,他想要尽快和导师讨论这里面的原理和做法。 伊恩在本吉奥的办公室门口来回徘徊了二十多分钟,本吉奥这才从远处大步流星地走了过来。 如果忽略头发和一把络腮胡中掺杂的白色,今年49岁的本吉奥其实看着相当年轻,只论这个面相的话,最多是一个三十五六的男人。 尤其是两道形状有些像憨豆先生的浓眉,让他显得更加忠厚,平易近人。 伊恩连忙往前跨了几大步,同时将自己手中的笔记和实验记录展开。他指着上面的几行核心的式子,正要开口的时候,却被本吉奥无情打断了。 “我知道你很急,但是你先别急。”本吉奥看着伊恩这个火急火燎的样子,调侃道,“我们做学术讲究的就是根基扎实,稳扎稳打。着急有什么用?着急没用呀。” “有什么话不能等我们进去了坐下慢慢聊呢?”本吉奥说着,掏出自己的钥匙,打开了办公室的门。“进来,这才七点多你就蹲在了我办公室的门前,想来一定有了什么重大的发现?” “很急,我真的很急。”伊恩深耕生成领域已经有段时日,在他昨天想到这个思路的时候,他就已经意识到了这将会是整个模式上的重大变革。 从本科开始到现在,十年磨一剑,伊恩非常兴奋。他有不错的学术嗅觉,能感觉到这个想法的不同凡响。自己的出头之日就要到了吗? 就在此时此刻,他可以感觉到这是一个绝佳的契机,能够凭借自己的实力,去摆脱吴恩达弟子,本吉奥弟子这一即是光环又是阴影的经历。 让世人真真正正地认识到他自己,通过自己提出的技术和算法来重新看待自己。 “两个网络的相互对抗吗。”本吉奥听完之后沉吟了一会,不像伊恩的几个朋友那样急着提出反对和怀疑的态度,本吉奥对富有想象力,富有创意的点子一直都是非常鼓励的态度。 “同时训练两个模型,而不是一个。生成器和判别器两者可以左脚踩右脚地螺旋相互提升。你是想通过这种模式,去让生成器的分布最终尽量接近于提供的真实数据。” “这样,我们也摆脱了寻常的思路,我们训练判别器,不是为了让它可以百分之百地判断图片是不是生成的。反而,我们的目的是为了让判别器再也不清楚到底哪些是真,哪些是假。”伊恩补充道。 “对抗只是一种形式,其本身的目的还是为了训练一个生成式的网络。我有信心,这种方式可以摆脱对数据标签的依赖,大量的其他数据可以在不需要额外处理的情况下被利用起来。” 伊恩直到此时,激动的情绪还没有平息。 “不仅仅是如此,生成只是最初步的应用。”本吉奥思索了一会儿,说道,“它完全可以通过对数据的筛选来达到特别的目的。只需要少量的代码调整,我相信它可以很好地处理布局简单的团,尤其是在人脸这样的方向,这是非常危险的技术。” “你打算给它取一个怎样的名字?”本吉奥一边说着一边打开了电脑,给技术起名字是一个难题,也是一门艺术。 名字取不好,工作全白搞。 一个响亮的名字,一个有趣而简洁的缩写,都很有可能会提升工作的知名度,受欢迎程度和应用范围。 “生成与对抗。要不,就叫它生成式对抗网络?”伊恩也还没有仔细去想这个问题,便将这个想法中最关键的两个元素给添加到名字当中。 “nerative adversarial吗,我来看一看。”取名的第一步,自然是检索,看看有没有人已经占了坑位。 本吉奥这一检索,远在天边的孟繁岐突然打了个喷嚏,心说这大夏天的,怎么还着凉了呢? “这个名字好像已经被人给占用了,就在前两天,非常不巧啊。”本吉奥此时还没有意识到问题的严重性,“看来我们要换另一个名字了。” 一边说着,本吉奥一边点开了这个预印本。 “drea是什么网络,好像之前没有看到过。”本吉奥依稀觉得这个名字似乎这两天有谁提过,但他忙于别的研究事宜,倒也没有太在意。 但刚刚看完摘要,本吉奥的眼神便犀利了起来,表情也变得非常严肃。 伊恩此时还在苦思冥想,到底用个怎样的名字会好一些。 而本吉奥则用一句话,无情地击穿了他的防御,“伊恩,看样子我们不能使用的可不只是一个名字啊。” “什么?我们的想法撞车了?”伊恩大惊失色,学术想法撞车,这对科研人员来说可能是最倒霉的事情之一了。 第23章 不幸中的万幸 后世的生成式对抗网络是非常知名的技术,热度相当之高。伊恩本人因为该技术一跃成为ai界顶流,他的另一大广为人知的贡献是《深度学习》这本花书,是该领域圣经级别的教材。 因此对这个技术的前因后果伊恩在采访中聊到了不止一次。 所以孟繁岐非常清楚,伊恩其实在历史时间线上要晚好几个月才开始想到这个主意, 孟繁岐根本没有考虑过想法撞车的情况,在他看来,时间差还有至少小半年呢。 可却没有想到,自己提前提出残差网络,将机器的千分类图像能力突破人类水准竟然带来了这样意料不到的连锁反应。 “我的老天爷,上帝啊”伊恩当场就是一个抱头下蹲,显得非常抓狂。 其实学术想法撞车不是什么新鲜事,有时候时间差了一两个月,大家也通常不会计较,甚至会传为一时美谈。 但那是一方还在审稿,另一方迟了一些时间投出的情况。 审稿时长的时间差,学术界通常还是认可的。 可若是自己文章还没有投出的时候,对方实验已经做好,文章也写完,甚至都公布出来了。 那不论再做什么,基本都是无用功了。 其实这个阶段发现学术想法撞了车,是损失最小的时候。伊恩还没有投入精力去正式开启该项目,或者开始论文的写作。 还只是在初期和导师讨论沟通的阶段。 但伊恩非常明白这个想法的价值,他之所以抓狂便是因为懊恼自己没能早几个月想到这个主意。 “撞车的内容多吗?我们的想法差了多少?”伊恩做了几个大动作发泄了一下自己的情绪,马上开始思索补救的办法。 学术想法撞了车,大家的车终究还是不同的品牌。 互有可取之处,有时候甚至早发的一方会给另一方启迪,促使对方的研究更上一层楼。 “非常可惜。”本吉奥一边迅速地浏览文章,一边摇头叹息道,“我们刚刚讨论的内容完全是对方的真子集。” 与此同时,办公室角落里的打印机已经开始“咔咔”作响,一张张a4纸缓缓飘落。伊恩知道导师是在打印和自己想法撞了车的那篇论文。 “已经以非常正式的论文格式公布了吗?”伊恩心中最后的一点幻想也破灭了。 “看这个tex的模板,应该是已经提交了今年的cvpr。对方的时间点可能比我们想的还要做早不少。” “让我先看看。”伊恩一个箭步上前,先翻阅了一下对方的摘要和几个公式。 才看了两分钟,就非常沮丧地一屁股坐在了办公室内的沙发上,“对方不是急着发一篇短文占坑的家伙。他们是有备而来。” 学术界有很多这样的人,不管有了什么想法,也不管三七二十一,先写个两三页就公布在arxiv上。以显得他们是第一个发现这件事的人,随后再慢慢做实验。 这样做不能说是错,但确实风气非常不好。 伊恩一向认为自己的嗅觉还是比较前沿的,这次即便撞了车,也只是对方急着占坑这个想法而已。自己一定还有许多操作的空间。 只可惜孟繁岐以非常周密的论文写作彻底摧毁了他的幻想。 不仅概念的定义,公式的推导非常简洁老辣,其基于drea的相关生成实验,结果也是前所未有的惊艳。 “drea,这不就是那个前几天赢得了ia2013榜首的方法吗?”伊恩恍然大悟,他觉得自己彻底懂了。 伊恩便是因为这个突破人类的性能而联想到,用另一个网络来做判别器,螺旋对抗提升生成器的性能。 自己既然是被这件事启发,那么早几个月设计出drea这个骨干网络的人,他的感触肯定比自己要更深。 继而顺水推舟,做了生成式的对抗实验,确实是理所应当,也是情理之中了。 想到这里,伊恩长长地叹了一口气。 也许输给了其他任何人,他都会觉得非常的懊恼。唯独输给这个drea的作者,让他觉得自己情有可原。 毕竟自己也是被这个网络的性能所启发的。 “你之前已经在ax-out,theano等事情上取得很大的成就了,怎么撞车了一个想法就一蹶不振了?”本吉奥看到自己的学生如同气球被扎了一针一样,泄了气。顿时感觉有些好笑。 “我们几个老家伙,那都是从ai不受待见的旧时代一点点熬过来的。”本吉奥发动了老人的通用技能,忆往昔峥嵘岁月。 “再往前十几年,有几个愿意承认我们神经网络的?不要气馁,振作起来。” 嘴上虽然如此安慰,但内心深处,本吉奥其实也觉得非常心痛。 他的视野比此时正处于激动和兴奋之中的伊恩要远要大太多。正如他之前所说的,这种技术在逼真的人脸生成,乃至于真实的物品,绘画,甚至视频相关的领域,都是有很大的发展与应用前途的。 虽然雏形只是生成器,但想要做成风格转移器,脸部修改器,真的只是一小点修改就可以做到的变种。 只可惜自己这边才刚有想法,别人的文章已经带着详细的公式推理,实验结果,甚至于多个领域的应用展望发表出来了。 “这可能也是不幸中的万幸。毕竟一切还没有开始。”伊恩沮丧了好一会,还是强自要振作起来。 他鼓励自己道,“如果真的是快做完的时候看到这盘文章,我真不知道自己该多难受。” 转过头来,他又看了看文章的作者栏。真搞不清楚这个ng到底是哪里冒出来的。 不过相比于比赛队伍中那个名不见经传的huang tang,这位deqg fu,好像还是有头有脸的。 伊恩用自己的手机检索了一下付德清的资料,越看眉头皱得越紧。 “这t不是个数学系教授吗?怎么跑来前沿的计算机领域捣乱来了!”伊恩很是愤慨,他其实有点怀疑自己是不是查错信息了。 但查来查去,也查不到其他同名的人看着像是那么回事。 “ng,我记住你了!下一次,下一次我一定会抢在你前面。”伊恩只得接受现实,并化悲愤为动力。 第24章 人生开始加速 2013年的11月,孟繁岐的生活难得的清闲了下来。 重生以来的大半年时间,他都忙于准备起步初期的论文,实验以及刚刚结束的ia竞赛。 这些东西都是他12月去澳大利亚参会的时候,能够和科技巨头谈条件的核心资本。 平心而论,即便是对重生人士来说,单打独斗的情况下想把这些事情做好也是不那么容易的。 至于唐璜,那只是一个无用挂件罢了,起到的作用聊胜于无。 前期工作做得越好越扎实,自己跨入业界的也就越高。这对之后道路的影响还是很大的。 如今,随着比赛的结果公布,还有生成式对抗网络的论文公布,这大半年的努力也到了收获的时候。 孟繁岐在参赛和arxiv公布论文的时候,故意没有留下自己的邮箱信息,便是想好好清闲这一个月的时间。 drea夺冠和生成式对抗网络的公布,螺旋叠加的影响确实超乎了孟繁岐的想象。这让他无比庆幸自己不留邮箱的决定。 孟繁岐故意吊胃口的论文公布方式确实起到了一定的作用,但本来的传播速度和效果远不至于会有现在这么好。 真正猛烈的一个催化剂是本吉奥这位大佬在社交媒体上的宣传。 “今天伊恩早早地找到我,说自己想到了一个绝妙的点子。我与他聊了许久,赞同他这是个非常天才的想法。不巧的是,这项工作刚刚被别人完成了。而且可以说做得非常完美了,他们已经发布了完整的论文和实验结果,(论文链接)。非常惊艳的结果,不过同时也让我有些担忧。ai能力飞速提升的同时,如何分辨信息的真假越来越成为一个值得重视的问题。” 本吉奥其实并没有刻意想要宣传的意思,他本人在这件事情上最关注的问题仍旧是ai伦理,真假辨别的问题。他希望ai技术可以造福人类,但同时需要得到一定的控制,不能够给人类带来诸多的麻烦。 但作为流派的三位祖师级人物,被他点名到的论文,自然会有一大批前沿的学者关注,以及一大批相关的媒体等着当素材。 而发现了这篇论文价值与超前之处的这些学者们,和好事的媒体们又会继续相互推荐宣传。 本吉奥的这条推特,大大加速了生成式对抗技术被学界关注的这一进程。 只是第一轮热度转了下来之后,大家都面面相觑,不知道这个作者ng到底是谁。 如今唯一知道孟繁岐联系方式的就只有已经加入谷歌团队的阿里克斯。 阿里克斯早些时间已经写了邮件来询问孟繁岐,只可惜孟繁岐作为华国人又在国内,如果自己没有主动用邮箱联系别人询问什么事情,这东西确实看得不大多,不大关注,因而便一直没有看到。 阿里克斯起先也没有太在意,距离孟12月上旬去澳大利亚会场,现身于世人面前还有三四十天的时间。 他的目的只是为了替谷歌邀约,选定一个大会前的时间面谈一下即可。这件事情也要不了太久。 但生成式对抗网络引起的巨大反响,让他一下子紧张了起来。 首先,这代表孟的水平和成果仍旧远在他们想象之上。作为去年走了类似道路的人,阿里克斯本以为自己是最不会低估对方价值的人,却没有想到终究还是低估了。 其次,非常致命的一点是,ng虽然看上去有点刻意隐藏自己联系方式的味道。可这次与他合作的教授fu,是一位在华国小有名气的数学界人物。 阿里克斯检索了一下付院长的信息,危机感一下子就升了起来。 通过这位合作者,其他人现在也很有可能已经获取了具体的联系方式。 甚至,像白度这样的华国科技巨头,已经可以去到这所高校与他面谈。 阿里克斯回忆起去年白度与谷歌竞价自己团队的激烈场面,顿时感觉有些恍惚。 攻守之势异也。 想到这里,他也顾不上等到孟繁岐回应他的上一封邮件,以确认他到底是不是自己要找的人了。 也不去想对方到底是什么原因没有回复自己的邮件。 他找到自己的导师hton,还有主要话事人jeff。迅速地敲定了一些具体条件的大概范围,直接准备了一封意向书。 这样一旦对方有回复,他就可以直接把详细的条件发到孟繁岐的邮箱中。 里面带着十足的谷歌诚意,从研究员的职位,性质,工作方式,具体薪酬待遇,乃至于签证绿卡的解决,住处,搬家费,股权,签字费等杂七杂八的事项。 统统考虑周全,并提供了多个备选的选项,供他选择。 最后,是一个邀约。 信中表示,谷歌希望可以尽快面谈,可以在加州硅谷山景城,也可以谷歌的人前往燕京,或者在澳大利亚的西尼,也就是ia今年的最终交流会场。 而晚些时候,终于想起来查看邮箱的孟繁岐,感到十分的诧异。 阿里克斯当初非常积极地回复了自己,解决了自己的问题。 结果等到他来信的时候,自己却差不多一周没有看邮箱。孟繁岐老脸一红,饶是他也觉得十分的不好意思。 看了下邮件的具体时间,孟繁岐大概也猜到了事情的情况。 也许是因为等得急了,也许是因为自己公布的论文引起了相当大的轰动。 阿里克斯发来的第二封邮件,不再是以自己的名义,而是代表谷歌表达了意向和邀约。 孟繁岐简短地回复了一下,正式地相互认识了一下。之后没过多久,阿里克斯直接回复了一个带有附件的邮件。 这封邮件给了自己一个初步的意向书。这不是一个非常正式的意向书,更像是一份介绍,甚至说是菜单。 他并不是只能被动地选择接受与否,其中给出了许多选项,以供他先考虑,等到面谈的时候再最后敲定。 这是重生以来,孟繁岐最紧张激动的时刻。他前面所做的一切,就是为了换来这些科技巨头意向书中一个比一个大的数字。 接到这封邮件的时候,孟繁岐明白,最有风险的阶段已经过去,他将要获得远远多于现在的资源,以后的路途只会越发平坦,越走越宽。 在他点开文件的那一瞬间,他冥冥有种感觉,自己的时间,自己的人生从这一刻开始加速。 自己所熟悉的环境,生活和人生的节奏从此不再,崭新的大门在此刻打开,里面散发出无比耀眼的金色光芒。 第25章 第一份Offer 谷歌给出的offer,各个地方的用料之足完全出乎了孟繁岐的预料,可以说是诚意满满了。 孟繁岐原本以为自己至少需要一番周折,或者需要其他公司的报价来谈判,才能够获得更好的条件。 可能是因为经历了前一年争夺辛顿团队的战役,谷歌在这方面的重视和专业的程度又上了一个新的等级。完全不希望给其他公司低价试探的空间,直接就拉到了满格。 孟繁岐打开文件还没有一分钟,就感受到了浓浓的人文关怀。他有些想不明白,谷歌是怎么把条件全都开在自己心里的。 文件里首先非常明确地表述了谷歌希望自己承担的职责和希望他加入的部门。 谷歌开出来的职位是谷歌大脑团队的研究员,谷歌大脑本部是在加州硅谷的山景城,但在海外也有不少处分部。 文件里盛情邀请了他去硅谷的总部,但也接受他在诸多分部中任选去处。 工作的主要内容是算法研究,研究的方向和范围并不加以限制,孟繁岐可以自己自由地选择感兴趣的研究方向。 孟繁岐看到这里感到有些震惊,不过考虑到自己目前展现出来的内容其实都是谷歌非常感兴趣的方向,这个条件倒也不算什么意外了。 而后便是自己的上司,谷歌直接搬出了辛顿作为自己的直系领导,算法方面的研究和讨论,可以直接由这位领域内的祖师爷来把关。 孟繁岐有些被彻底打动了,这个条件不仅表现出了十足的重视,同时也给了自己非常好的机会,去跟这位领域内顶级的人物多多交流。 如果说之前孟繁岐是将谷歌作为首选的话,现在可以说他已经基本锁定谷歌了。 并且,决定前往硅谷的话,公司方面还负责直接摆平签证,绿卡和住处等相关事宜。这些琐事如果自己去操心,还是非常繁琐复杂的。 光是查阅各种资料都非常繁琐且折磨,如果有谷歌的专业团队代劳,自然是再好不过了。 太周到了,太周到了。孟繁岐看得嘴角都快裂开了。 虽然他并没有任何移民又或者是更换国籍的计划,但有一张永居绿卡,确实会让许多事情更加方便。 最最让他感到舒爽的就是,文件中只对每年的产出和结果有所限制,完全不管他是否来上班打卡,又或者是否有自己的事业或者学业安排。 只要按时与辛顿沟通交流,在算法和技术方面有稳定的进展和成果。其他的,谷歌一概不问。 这对不需要苦思冥想新的想法,逐一去实验试错的孟繁岐来说,几乎就是不需要怎么投入时间的工作。 他很清楚各个主流任务的发展脉络,只需要按部就班地快节奏推荐各个方向的发展即可。 “这简直就是神仙一样的工作啊。”孟繁岐其实这大半年来已经做过很多次拿到职位的美梦了,但实话实说,他梦里的内容更多的是在想价钱的事情。 对其他方面的想象可以说是远远不够。 “这待遇我就是在梦里都不敢想啊,根本想都想象不到!”孟繁岐总算是明白了,什么叫做爸爸的快乐你想象不到。 作为打工时长四年的打工仔,重生之后或许他对金额有一些幻想和追求。但对这种其他方面的关怀,他已经被生活折磨地缺乏想象力了。 接下来就是最关键的内容,也就是真金白银的部分了。 孟繁岐深深吸了一口气,往下继续翻页。 谷歌给出了几种不同的方式。 一是由孟繁岐直接成立一家空壳公司,里面什么资产都没有,不过这种方式的话,孟繁岐可以自己选择2-3名员工加入进来。 然后由谷歌直接把这个空壳公司收购,如此一来,他愿意带着的人员也会由这种方式加入谷歌。 这种方式,谷歌会一次性付出很高的金额来收购公司。几人也可以按照股权的比例来分这笔收购款。 不过后续的雇佣,还是要看他带来的人是否有能力在谷歌工作下去。去年的辛顿团队三人便是这种模式。 另一种办法,则是天价签字费的模式。 谷歌愿意提供五百万美金两年,或者九百万美金三年的签字费,两种不同年限的选项。 不管是签字费模式,还是收购空壳公司的模式,谷歌都会提供正常的每年薪水给到自己。 这个薪水由基础工资,股票和奖金三部分组成。 这份文件里给出的金额是,基础工资30万美金每年,股票每年兑现价值为65万美金的股份。 如果每年的工作情况令人满意,还会有大约10-15万美金的奖金。 孟繁岐估算了一下,这就相当于250万人民币每年的薪水,加接近400万每年的股票入账。 虽然说真正的大头,是直接的一大笔收购费或者签字费,总价值约6000万人民币。但除此之外的每年薪水开得也相当之高了。 根据孟繁岐对谷歌职级的了解,这是一般分部的总监才能够拿到的金额。 谷歌的巨牛jeff属于l11等级,该等级只有2人。大多数谷歌元老或者创始人在l10等级。 虽然没有直接给到高等级的名分,但谷歌给自己开出的每年薪水待遇,已经高达l8左右的级别。要知道正常毕业的博士生,在谷歌的职级也只能拿到l4-l5左右。 需要熬个五年十年的,才有资格到l7左右,距离l8还差很大一截。 由此可见,谷歌这份offer的诚意到底有多么的厚重。而他们要在ai方向成为业界巅峰的决心又有多么的坚决。 当然了,这个文件只是一个沟通的意向offer,并不是自己现在马上签署就有了法律效力。 等到面谈的时候,如果自己的表现不尽人意,谷歌完全有直接撤销offer的权利。 不过即便如此,这份offer中的数额也很让人满意了。 尤其对于股票的额度,相当慷慨,此时谷歌的股价还在25-27美元左右的低位,这些积攒下来的股份,日后也会持续走高,在21-22年翻出六七倍的价值。 “说起来,我买btc的第一桶金这时候也该兑现了。”算了半天的钱,孟繁岐突然想起这回事。btc在今年年末是最近几年的最高点,自己那88个btc,现在能换个60-70万呢。 第26章 不堪其扰 这段时间一直忙忙碌碌,孟繁岐险些忘记了自己年初曾经买过btc的事情。 “这个时间段要买卖btc这种东西,还是稍微有点麻烦的。”孟繁岐检索了一下,几经波折,手头的大约88枚也无法一口气顺利出光。 还得需要化整为零,分几次出手。 “好在金额不是很大,其实加在一起也只有六十左右。”孟繁岐清楚,华国对这方面的管制还是较为严格的。 倘若真的再加一两个零在后面,光是想要合理合法地拿到手,都未必是一件简单的事情。 晚些时候,第一笔款项,25万已经入账。这同时也是他归来之后账面上增加的第一笔大数字。 “先转20万给二老,让他们安安心。”孟繁岐此时没有什么地方需要花钱,便决定把大部分先转给父母。 有了这笔钱作为证据,两位至少不会整日忧心忡忡,觉得自己不学无术了? “不,不是的妈,我真没干什么违法的事情。” “这钱也不是我借来的,骗来的,儿子现在是技术创新。技术懂?” “额读大学跟搞技术是两码事,这些创新内容都是学不来的,真没骗您。” “好好好我肯定读书,过完年一定继续读书。” “别别,这钱别存着,该花就花,该买什么就买什么。” “好嘞,好嘞,过年的时候我一定回去。回去了再跟你们细说。你们就放心” 经过一番地狱级的对话,孟繁岐总算初步打消了父母的疑虑。 挂了电话,他熟门熟路地来到数院大楼五楼,敲响了院长办公室的房门。 这次付院长难得主动联系自己,想必是被各种邮件给折磨坏了?孟繁岐心中暗笑,虽是好事,却也容易不堪其扰。 “进来。”付院长的声音依旧沉稳,但不知怎么,孟繁岐感觉这个声音听起来似乎有些沉重。 “新闻看了吗?”孟繁岐刚一进来,连招呼都没来得及打,付院长便已经出声询问。 “看了些,虽然严肃媒体的评价还是比较收敛,但大部分学界人士还是以好评居多的。”孟繁岐以为付院长说的是论文和竞赛的事情,心头一暖,没想到这点小事付院长还要专门见面谈。 “没跟你说论文的事情。”付院长以手扶额,他听出来,这小子是整天蹲在外网自己搜自己呢,压根没怎么关注国内的新闻。 “来看看这个,现在热度不低,学校方面不好解决这个问题。否则我也不会专门让你过来。” 付院长将自己的屏幕转了过来,孟繁岐上前两步,看向屏幕中间的文章标题。 《世界瞩目的论文作者休学,燕京电力大学使明珠蒙尘》 文章先是对孟繁岐生成式对抗网络引起的反响极尽溢美之词,看得孟繁岐脸都红了。 但细看字里行间可以看出,作者并不懂得这个方向的专业知识,其用意也不是真的宣传该技术,而是另有目的。 在几句驴唇不对马嘴的内容介绍,和非常浮夸虚伪的夸赞之后。文章笔锋一转,开始着重渲染作者休学的幕后故事。 几乎将孟繁岐塑造成一个聪明努力,却又处处被学校刁难的形象。看得孟繁岐一脸懵,他大一大二动不动就翘课去网,怎么现在突然变三好学生了? 再看后面,撰稿者极力营造一种学生怀才不遇,高校傲慢顽固,管理失败的对比。全然不提文章的作者栏中还有另一个人,也就是燕京电力大学数院的院长。 铺垫完这种反差之后,文章便开始展露自己的真实面目,又回到那一套经典的流程“这国怎,亏总民,我陷思,定体问”。 不谈论文章本身的技术,内容和影响,不去分辨付院长署名本身意味着什么,一昧地营造一种对立的氛围。 文中虽然没有使用任何比较强硬的词汇,又或者是断言。但无处不在暗示和诱导读者去往双方对立的方向去思考。 撰稿人,袁舟子。知名评论家,打假人,其公共社交平台的粉丝数量大都数百万。 孟繁岐看到这个名字,眉毛皱得都快拧不开了。 即便不关注此人,他也大概知晓这是个怎么样的狗皮膏药。 早些年干得都是些打假的事情,倒也让路人有三分好感。 但不知不觉之间,就开始变得魔怔了起来。 自己的观点和看法容不得半点质疑,但对别人的怀疑和指责却不需要半点证据,全凭一张嘴。 越到后期,他怀疑的事情就越多,指责的事情就越多。 在孟繁岐的印象里,他后来打假多个知名院士\/科学家,经常拿不出什么证据。 频繁针砭时弊,预测社会或国际事件,也经常南辕北辙。 其人后来好像因为名声太臭,离开围脖跑到美国去了,而后便没什么消息,孟繁岐也渐渐将此人遗忘。 “这点小事,怎么会惹上这种难缠的家伙?”孟繁岐感觉事有蹊跷,他印象中这人很爱去蹭知名人物的热度,自己这种无名小卒他怎么会看得上眼? “这盘论文虽然在国外学界有点反响,但放在华国社会这大池塘里,最多算非常不起眼的一个小水花。他又怎么知道我办理了休学?” “唉这出闹剧跟你这件事情本身没有什么关系,你不要多想。”付院长沉吟了一下,还是不想告诉学生过多内情。“这种事情,学校会讨论处理。我今天叫你过来就是希望你不要贸然地发表一些言论。只当做什么事情都没有发生。” 他觉得孟繁岐的潜力深不可测,不希望他知道这些斗争,让这些俗物俗事影响到他。 只是他完全没有办法料到孟繁岐脑中有另一条时间线的记忆,听付院长说和自己其实没什么关系,回忆里的一些碎片便串了起来。 “当年的这个时候,好像是院士评选的事情。”孟繁岐猛地回忆起往事,院士评选往往是奇数年六月和十月底。 如今刚过完十月,难道是有人对结果不满意? 孟繁岐不大记得当年的此时到底发生过什么了,只记得老校长后来是15年才评上工程院士。 当时不少同学都在朋友圈发了,因而他有些印象。 “原来是我把事情想的太简单了。”孟繁岐喃喃自语,他本来还以为,只是一个难缠的网络公知四处咬人,误伤到自己。 “付院长,我知道您是好心,想要保护我。但如果这件事被作为靶子,影响到了学校,我也应该站出来澄清此事。” 孟繁岐虽然不够喜爱这个专业,后来也未从事这方面的工作,甚至当时也不知道自己为什么要来到这里。 但他始终认为,不管是上一辈的四年,还是这辈子的两年,他在这里的生活都非常愉快。 如果有人通过他来污蔑这所学校,不论其目的到底是什么,他都要尽己所能。 “那好,你跟我来。”付院长思忖了半晌,叹了一口气。 第27章 造谣容易澄清难 燕京电力大学主楼,礼堂侧面的一个中型房间被用作了临时会场,由校党委羊书记牵头组织,只要现在没什么事情的行政领导,都被叫了过来。 会议也没有三大项五小项,唯一一个问题就是打假红人搞出的这场闹剧,如何公关收场,才能给学校,给校长的影响降低到最小。 《世界瞩目的论文作者休学,燕京电力大学使明珠蒙尘》,这篇文章虽然没有明确地指责什么,但暗示的东西直指教育的核心,用心险恶。 如今不少不明真相的群众,都觉得学校没有能力教育人才,甚至没有能力去分辨人才。 “我觉得就是那几个人干的。”电院的一位老教师语气不善,“刘校长的研究和履历没有问题,他们想不出法子,于是就拿咱们学校做文章。” “咚咚。”羊书记皱着眉头看了这位老教师一眼,重重地用拳头敲了敲桌子,示意这样的话不要乱讲。 学校出了丑闻,校长确实要担最大的责任。不管这个丑闻是真是假,总会影响到其声誉。 尤其是在这个工程院院士二轮刚讨论完的时刻,更是敏感至极。 这个时候出点什么岔子和新闻,说不定就能起到决定性的作用。 但要在公开场合毫无证据地做这种猜测,着实不大体面。 “要我说,我们学校出了这样的学生,取得了这样的成绩是好事。怎么就被这个人说得像是坏事一样?”数院的一位老学究刚来,还没理清楚其中的险恶。 “论文我仔细看过,非常精彩,很多博士生都没有这样的水准,我听说在国外的反响很好。而且,其中也有我们付院长的参与和指导,我看那个什么围脖上的人,可能根本不懂付院长作为通讯作者意味着什么。我们好好跟他沟通沟通,指出他的错误,消除其中的误会,或许可以让他删除文章。” 明明是学生出了成绩,结果确搞得胆战心惊的,参会的教授都觉得很是憋屈。 “梁老啊,也就是您老会这么想了,您不怎么上网,不了解情况。您是不知道啊,网络上是不可能有人会承认自己的错误的,尤其是他袁舟子。就是错的,他也要嘴硬到底。他袁舟子就是说地球是方的,你也别想让他承认错误。” 梁教授醉心学问,以己度人,把网络上的人想的太过善良,马上就有年轻的教授忍不住说穿了事实。 “他袁舟子又不是没读过硕博,还能不清楚这个?”羊书记端起瓷茶杯,拿开杯盖吹了吹,“他这就是装糊涂,装糊涂的人,道理能说明白吗?装睡的人,人家能叫醒吗?” “我们要做的只是尽力让群众相信,至于袁舟子怎么想,那不在我们的能力范围之内了。” “羊书记,这件事情实在不好办。”有的老师负责这方面比较多,非常清楚这里面的门道。“这件事我们越是去澄清辩论,那就是越正中下怀了。袁舟子一定会搬弄是非,歪曲我们的说法,一直让我们提供更多的证据。” “不知不觉当中,我们就会陷入无尽的自证。他造谣让别人误会我们容易,我们想要澄清清楚事实,那可就是千难万难了。” 一旦和袁舟子这种人陷入缠斗,那就永远不会有赢的可能。 就像和猪在泥里打滚一样,时间久了你就会发现,原来猪非常享受。 羊书记面寒如霜,他当然知道对方就是个滚刀肉。但事已至此,装死假装无事发生,这样的事情他是绝对做不出来的。 该公关,该通告的东西,还是要公告清楚。尤其是学校教授,付德清在其中的贡献。不能任由别人随意扭曲事实。 至于效果如何,群众们信不信,那只能尽人事听天命了。 “羊书记,要么我们还是让付院长把这个学生带来。” “是啊,这种事情我们说再多,也不如当事学生说几句来得有用。” “我们一所大学,保护不好自己的学生,难道还要学生露面去保护学校吗?”羊书记直接叫停了这种论调,在他看来,不管学生因为什么原因休学,学校都有没有做好的地方。没有给与足够的支持。 现在学校有舆论上的困难,反而要去麻烦学生出力?羊书记觉得自己丢不起这个人。 与此同时,孟繁岐正在前往主楼的路上,他本来没有围脖的app,为了这件事还特意下载了一个。 打开围脖的评论区,发现里面大多是一些被调动了情绪的吃瓜网友。 “哇,我们的教育问题真的很大啊,太守规矩,讲规则,没有创造力。” “要么怎么说我们总是出不了牛顿,爱因斯坦这样真正厉害的科学家呢,都是被这种教育的方式给扼杀了。” “太悲哀了,有这样的好苗子却不知道培养,让人都休学了。” 把孟繁岐看得非常无语。这个时间点虽然很多网友们已经反应过来了网络公知的无耻和双标,但仍旧处于过渡期,容易被公知忽悠。 再过个几年,公知这碗饭就没那么好吃了。往往是网友放出一些段子和假新闻来钓公知的鱼,看他们的笑话。 这种动不动就反思的逻辑,着实是太离谱了。说到科学创造,就说华国人太守规矩,说到什么生活习惯,社会礼仪,又找些个例,说华国人太不受规矩。 只要有一个华国人行为不恰当,就可以推论全体。而看待外国人则反之,只要一个外国人做了好事,则就是体制,民族的优越性。 这本质上其实就是一种莫名其妙的自卑,并且自己跪得久了,还见不得别人站着。 整天愤世嫉俗,将自己的一切失败都归咎于国家或者其他原因。 在各种社会事件下大刷“悲哀”,然而实际上并不关注后续,也不在乎事情是否得到了解决和改善。 就比如这些人在这次事件里,看似是为了自己伸冤鸣不平,觉得自己明珠蒙尘。 但实际上极少有人会真的关注自己,自己为何选择休学?休学是否更有利于自己出成果?研究成果是否和学校的教授合作产出? 这些都不是他们关心的事情,他们所需要的,只是一个可以抨击,抒发自己心中郁愤的借口罢了。 这么多网友反思了几千楼,只有少数网友真的打开这篇论文看了看,可惜他们的评论都被压在了很下面,无人关注。 孟繁岐无力地叹了一口气,对于这样的事情,实在没有什么好的办法。因为他很清楚,大部分人骂过一句之后,就再也不会看了。 第28章 联合声明 主楼侧面的会议室,几位教授和学院领导争论地热火朝天。 羊书记明显希望学校可以直接解决此事,不要将压力给到取得了成绩的学生身上。 如此一来,好的办法确实不多,几位教授你一言我一语,出了不少注意,但稍微仔细思索,总觉得各有利弊。诸人各执一词,始终没能达成共识。 就在此时,付院长推门而入,所有人的视线齐齐望向这边,声音也为之一滞。 孟繁岐刚一迈进们来,就发现在场的所有老师都盯着自己,方才热火朝天的会议室如今陷入了迷之沉默,顿时觉得十分尴尬。 “德清,你是怎么回事?我都说了让你好好安抚学生,不要让学生受到舆论的影响。你把他带到这里来做什么?” 羊书记不知道这位学生是谁,但他方才安排与这位同学合作的付院长去联系这位同学,此刻他却带了个学生回来,羊书记自然也就猜到了。 其本意是要为孟繁岐做些思想工作,羊书记很重视这方面的问题。 很多大学生的心理素质都远比人们想象的脆弱,因为一直在校园中努力学习。不少人从小都被父母和师长保护的很好。 有些同学经常勤工俭学,接触社会较多,往往心理坚强不少。但也有很多同学的生活很简单,遇到一些事情的时候很容易想不开,做出傻事。 羊书记年轻的时候就曾经失去过一个非常优秀的学生,虽然他至今也没法理解原因,那位同学究竟为什么因为一些小事就选择轻生。 但这件事让他逐渐形成了如今非常重视学生心理健康,心理问题的教育方针。 “羊书记,不是我要带他来,是他自己要来的。”付院长有些无奈。 羊书记往下拉了拉自己的老花镜,看了看跟在付院长后面的孟繁岐。其余几位老师也是第一次注意到这位同学,彼此之间眼神交流了一番。 “孟同学,来来来,你坐这边。我向你了解一下,一些事情的具体情况。”羊书记顺手拉开身边的一把椅子,示意孟繁岐坐过去。 “羊书记您问。” “我首先想了解一下,你办理休学的具体原因和一些情况。”休学不仅是袁舟子搬弄是非文章中的主要攻击点,同时也是羊书记比较在意的问题。 “你学习上是不是遇到了什么困难,或者生活上有什么难处,和同学,和老师直接,有没有产生一些矛盾?” 学校的事情虽然紧急,但羊书记还是将学生的事情放在了前面。 “羊书记,您就放心。类似的问题付院长还有我父母其实都已经问过很多次了。”孟繁岐本来想着休学也是偷偷休了,却没想到如今弄得满城风雨。 一屋子各院校来的一些行政老师和领导,围在这里听羊书记询问这个问题。 “我完全是因为个人的兴趣和天赋与专业不符,希望在休学的一年时间内可以去确认自己的目标,看看能不能做出一些成绩。毕竟如果努力的方向不对,再努力也只会南辕北辙。” “就没有其他的什么原因?有什么问题都可以跟我说。”羊书记仍旧不放心,还是追问了一句。 “从结果看,你的选择还是比较正确的。”旁边有计算机和软件院的教授插嘴道,“这才没多久,就出了一篇这么高质量的论文。” “其实我这段时间在付院长的指点下,大概已经准备了七八篇文章。”孟繁岐之所以选择要出面将事情澄清清楚,就是因为这个原因。 “所以我在想,如果这一次我不和学校一起将事情解决,往后的时间里,它可能要一直反复影响到学校。” 羊书记:“” 其他一众教授也都被噎住了。 道理确实是这个道理,如果不解决,孟繁岐每次发表什么成果,说不定都会有人把这件事再翻出来说。 只是一个本科生大半年的时间产出七八篇论文怎么听着就这么不对劲呢。 会议室里再一次陷入了迷之沉默,半晌,羊书记才咳了两声,用眼神暗中询问付院长,“这小子说得是真的吗?” 付院长缓缓点了点头,并出言补充道,“而且文章的质量都相当之高。” 这个成绩实在太过匪夷所思,但在场的众人都信任付院长的为人。有他作为合作者,大家都认可了这个成绩。 “我们都知道这篇文章的反响非常好,但确实没有了解到,原来你还有不少其他的成果。这本来是一件好事,但现在被有心人当做武器来攻击学校。” “你愿意出面澄清,维护学校的声誉,我非常感动,也很自责。虽然说年轻人都比我们老头子懂网络,但在这种社会事件上,一旦你站到台面上来发表观点,不可避免的会有很多不理智的人,或者心怀恶意的人,蜂拥而至,用恶毒的语言来攻击你。” 说白了就是网络暴力嘛,孟繁岐了解羊书记担心的事情。 很多人可能会低估网络暴力的威力,觉得网上反正也是假名。 但实际上,如果真的有成百上千的人刷屏骂你,打开某个app,信息999+全是没有理由的恶意。 这对大多数人来说是很难承受的。 尤其是网络暴力经常伴随着个人信息的泄漏,这些施加暴力者往往会觉得自己是正义的化身,但却经常没有搞清事实就把受害者的所有信息公布在网上。 当这种恶意在现实中也能感受到的时候,其威力会上升好几个数量级,让人惶惶不可终日。 “羊书记您放心,我知道自己在做什么。”这次事件其实还好,袁舟子的主要目标是学校声誉,将自己作为工具刻意抬高,所以现在并没有什么人在攻击自己。 出面澄清之后,最多也就是一些美分来骂自己是走狗。孟繁岐觉得自己完全应付得来,这点火力到时候谁骂谁还不一定呢。 “那好,舆论上的事情,学校今天下午就会做出公开的回应。希望你也配合我们,同时在几个主要波及的平台上,说明一下情况。” “没问题。” 第29章 反其道而行之 袁舟子最近的生活非常滋润。 吃完晚饭,袁舟子扫视了一下自己开辟的几个战场,对热度和反响都相当满意。 他依靠打假起家,最近两年逐渐爱上了当杠精博取流量那一套。 这也不能怪他,只能怪去年那场战斗,给他带来的好处太大了。 袁舟子其人,里程碑事件之一就是和知名青年作家那一场关于“你怎么证明你的作品是你自己写的”的大乱斗。 2012年前,韩涵作为青年作家,青年意见领袖,风头一时无二。在blog,围脖的号召力和粉丝量都冠绝全场。 只可惜文人总是容易得意忘形,韩涵12年陷入被质疑代笔的风波,本来大胜质疑者麦子。 结果一时间高兴极了,言辞之间没有注意尺度,惹上了袁舟子。 再次陷入被质疑的风波后,韩涵进退失据,总是想着自证清白,结果疑点也越来越多,越描越黑。 这件事情到最后,都没有一个能够令所有人信服的定论,彻底变成烂账。 支持双方的人都有自己的理由,谁也说服不了谁。 但有一点是肯定的,那就是袁舟子依靠此事获取了巨大的热度和流量。 韩涵事件之后,袁舟子隐藏在“打假斗士”称号下的杠精属性暴露无遗。尝到甜头的他,操作也开始变形。 今年年初的时候,袁舟子和罗勇浩两人不知怎么打了起来,缠斗至今。今年迟些时候,就在上个月,袁舟子还和央视主持人崔勇元就是否支持转基因一事,展开了激烈地争斗。 这次撰文攻击教育体制,仅仅是他忙里偷闲,夹带的私货罢了,都算不上是他的主战场。 收钱办事罢了,袁舟子一击即脱,发文之后甚至都没有太关注这件事情。 此时他仍在国内战场,因而还算有些分寸,只是偷偷夹带一些私货。在孟繁岐的印象中,此人躲到美国去之后,直接造谣抹黑华国的操作可多了去了。 只是顺带黑了一下,却不曾想效果还不错,袁舟子乐得合不拢嘴,嘴巴的弧度险些将那张大方脸一分为二。 燕京电力大学针对自己文章引发的风波,发布了一则声明。但这种官方的声明一般效果也就那样,起到的作用只能说是聊胜于无。 被自己打了先手,落入被动的境地。吃瓜群众们先入为主,这种非常书面的东西是很难让吃瓜群众买账的。 也就是这时候反转还不够多,群众们容易轻信袁舟子。孟繁岐看到围脖的澄清下面仍旧“悲哀”声不断,叹了口气。 等再过几年,来回反转的事情多了。网民们才会对这些事情更谨慎些,看热闹的时候会等一等,让子弹飞一飞。 燕京电力大学的声明围脖下乌烟瘴气,不得已锁了评论,这下子让围观的群众更加坚信了自己的猜测。 不让我留言,肯定有问题啊! 袁舟子吃晚饭没事做,看到燕京电力大学的声明评论区锁了,连忙编辑了一则围脖,把这些无法留言的热度引到自己这边来。 “燕京电力大学给出了回复声明,非常官方的回应,丝毫不提教育方式方法的问题。通告下面还禁止留言去回复讨论,难道这就是我们大学的理念吗?惧怕交流讨论,对于提出问题的人直接让他们住嘴了事。我可以闭嘴,但问题就得到解决了吗?” 微博发出之后,热度迅速上升。 在学校声明区里无法留言的人纷纷跑来袁舟子这里发泄。 不一会的功夫,就有了好几万的点赞和数千条评论。 “真是太悲哀了,我们的教育。” “如果是在国外,一定” 好!好啊! 袁舟子看到这数据增长的速度,高兴坏了。 和罗勇浩,崔勇元还有韩涵争斗,总是需要高强度对抗,经常还有许多粉丝来攻击自己。 虽然袁舟子的脸皮厚度可以绕地球两圈,但人挨骂了总会有些不舒服。 没想到引导暗示这种内容竟然如此有市场,实在是一举两得! 一边打着饱嗝,袁舟子一只手摸着自己的肚皮,另一只手刷着自己的围脖评论区,时不时地删除一两条不利于自己的评论,以引导整体的风向。 突然,他注意到相关的评论区开始有不少人在转发一篇文章。 点进去一看,发现是自己用来攻击燕京电力大学的工具人,孟繁岐本人的澄清文章。 “哈哈,区区本科生还是太嫩了。一旦你要协助学校联合澄清,你就会被吃瓜群众打成一个群体。”袁舟子颠倒黑白的事情干得多了,起初用这个学生当工具人的时候,就想到了这一点。 “学校拉学生出来澄清,很容易可以被我包装成压迫或者收买。”袁舟子根本毫不在意,他前一篇文章可以说他是蒙尘的明珠,下一篇文章也可以把他说成被学校收买的堕落小人。 “只要稍稍暗示他从学校那里获得了利益,则很轻松又可以拉开角度继续攻击。” 袁舟子已经开始酝酿下一次攻击的角度了,但继续往下看这篇文章,却发觉情况有些不大对劲。 这小子用的好像是以退为进的手法。 孟繁岐压根没有用澄清的方式和逻辑去写这篇文章,新媒体的话术每年都在迭代,他太清楚正儿八经的公告是没人看的了。 他响应学校发的这篇短文叫《每个人都可能是蒙尘的珍珠》。 采取的招式是推己及人,引起共鸣。 文中开篇先讲述自己高考时选取专业的迷茫和无知,大一大二时兴趣缺缺,成绩不理想。 这些事情是大部分经历过高考的人都有共鸣的,无形之中已经拉进了这些读者和写作者的距离。 而后,孟繁岐简述了自己休学是为了专心在感兴趣的领域取得成绩,陈述了一些成果,并重点突出了付院长对自己的启迪和帮助。 文章的中端部分主要对大学专业的重要性进行强调,反思和讨论了现在大学对更换专业的限制。 最后,则提倡学生和家长要关注学科专业和学生的兴趣,呼应标题,只要能够发掘学生的兴趣,选择正确的学科,那么每个人都可能是蒙尘的珍珠。 全文不刻意去解释和声明,反而对学校的一些制度和想法进行了反思和讨论,并给出了自己的看法和建议。 但却将袁舟子的核心依据完全瓦解,并引导大家的注意力转移到了大学专业和人生的关联上去。 第30章 掎角之势 作为曾经的祖安老喷子,孟繁岐深知,对于网络上的论战,以驳倒对方为目的是没有意义的。 网络吵架的时候,最主要目的应该是恶心死对面,而不是讲道理去辩论。袁舟子就是个中好手,什么情况他都能继续挑刺。你越理他,他就越兴奋。 在这样的社会事件中,则应该去引导舆论的方向,自己说自己的,而不是和袁舟子这样的人在泥潭里打滚。 虚拟的世界里永远不会有人认错,不仅是对方如此,其实吃瓜群众也是如此。 倘若你极力要证明吃瓜群众观点错了,那可就费劲了。人有一万种办法可以否认自己不愿意相信的事情。 只要他的脸皮够厚,你拿出什么证据,他都可以说是假的。图片是p的,视频是剪的。 有权威人士帮你说话,他说你有能量,暗示对方袒护。 没人帮你说话,他说你失道者寡助,过街老鼠人人喊打。 人非圣贤,孰能无过。越积极要证明自己,就会越落入陷阱,吃瓜群众们就越不肯相信,要找你的茬。 而谁又能真的做到一点破绽都没有呢? 孟繁岐从一些着名社会事件中已经得出了结论,想从舆论战中脱身,不管自己有错没错,最好都要露出一点破绽。 自己先把问题说了,不少网友其实也就没有那个闲心思找那个茬了。 毕竟绝大部分网友其实也只是见不得人睁着眼睛说胡话罢了。 孟繁岐的澄清文走得便是这个思路,休学一事,本来只是因为他的私人原因,觉得没有必要浪费时间在电气专业的课程上。 抛出大学转专业困难这个问题,是为了让大家有发泄的方向,这也是切实存在的问题。 至于他个人的情况和经历,一部分是真情流露,忆往昔峥嵘岁月,另一部分则是为了先抑后扬。通过自己的前后转变,突出选择适合自己专业和方向的重要性。 通过类似经历和一些相同情感的共鸣,将大家的注意力转移到专业和自己人生的相关话题上。 “没想到学霸也有和我一样的时期,哈哈!四舍五入我也是个学霸了!” “谁说不是呢,我本硕读了七年,还加考研二战一年。结果到头来干的是完全不沾边的工作。真不知道读了个啥。” “我们太关注高考了,对专业选择这方面完全不够重视。很多时候学校差一些其实没差那么大,专业不好那可就是完了大蛋了。” “说得真是啊,生化环材四大天坑,我要是当年知道该多好。” “这位同学说得非常不错,高考,考研志愿和学校的选择都很重要,我是张学峰老师,请看我的视频【链接】,七分钟为你解读34所985高校。” “哈哈哈,楼上讲段子的是。” ??? 跑我这儿来宣传自己的课来了是? 孟繁岐正在自己文章的评论区刷着评论,没想到看看到了后来的考研名师张学峰。此时他名气倒也不大,不过讲段子的风格已经基本成型。 孟繁岐一直觉得后来考研人数如此爆炸,有相当一部分原因是因为此人不懈地宣传。 不过目的确实已经达到,孟繁岐叹了口气,感觉吃瓜的网民们就像羊群,人往哪里赶,他们就往哪里走。 文章发出之后,很多网友开始回忆起了自己高考和考研时的一些故事,还有相当一部分人跑去看张学峰的段子去了。 有了这段经历和故事,写出“反响极佳论文的学霸”一下子距离变得特别近,好似就在大家的身边,让不少人的立场开始发生变化。 袁舟子攻击学校和教育的逻辑被悄然化解,目睹这一切的袁舟子此刻心中懊悔不已。 自己还是太大意了,没把这个外快当回事,最开始选择的角度就不好。 当初为了抹黑燕京电力大学,将这个小子往上抬了一抬,现在这小子打感情牌,经历牌,不否认自己的休学是因为现在大学转专业难,自己一时间还真没有好的办法再合理切入进战场了。 这是化劲儿,如果再拿出去年的那种杠精的劲头,只会让自己看起来像神经病。 “这下坏了,热度才刚起来就被化解,那我后面的钱还拿不拿得到了?”袁舟子问了一个答案非常明显的问题,事情没办成还想要收尾款,那显然是不可能,前面的部分不来找你讨要回去就不错了。 与此同时,央视主持人,和袁舟子已经开打几个月的崔勇元也切入了战场。 “袁舟子这样的人是连自己的母亲都不会认的,‘你说你是我的母亲,你有什么证据?你怎么证明?’” “模仿得真像啊!” “哈哈哈,小崔好强的攻击性!” “打起来,狠狠地打!” 一群网友看热闹不嫌事大,公知批评院校和教育,哪有直接和央视主持人对骂看得过瘾? 孟繁岐精心准备的招式还没能真的起到很大的作用,风向便被小崔以这种出人意料的方式再次转变。 两人你来我往,拳拳到肉,打得不亦乐乎。看得孟繁岐实在是哭笑不得。 罗勇浩也借机下场,爆锤袁舟子,“很难想象一个精神有疾病,心理残疾,人格扭曲,自己老婆学历都造假的人有资格去评论教育相关的事情。” 袁舟子行走江湖靠得主要是撒泼打滚,各说各的,抓着对方死死不放手。要论语言水平,比起央视名嘴崔勇元和脱口秀达人罗勇浩可差得太多了。 两人突然呈掎角之势,一前一后前来夹击,瞬间局面呈碾压的状态,袁舟子顾此失彼,无法组织起有力的反击,只能抓着几句歪理使劲复读。 尤其罗勇浩又直接附上了他线下对线袁舟子视频,袁舟子线下一反线上的狂态,唯唯诺诺,只低头看着手机。一见到罗勇浩就灰溜溜地钻进电梯跑了。 罗勇浩则全程说脱口秀一样,把袁舟子拉出来挡枪的律师说得一愣一愣的。 “哈哈哈,大肘子线下就这?” “整个一缩头乌龟啊。” “笑死人了,这样的人也配出来指点江山?” “袁舟子这个基金到底怎么回事?真的是骗钱吗?” 随着罗勇浩的强势出击,局面再次急转直下,方舟子紧咬牙关,气得狠狠地把手机摔在了地上。 第31章 有备而来 袁舟子几人混战,打得那叫一个热闹,吃瓜群众们几乎完全把最初的起因给忘了个干干净净。 天下熙熙,皆为利来,天下攘攘,皆为利往。 袁舟子哗众取宠是为了博取关注,赚点流量钱,黑点打假基金。 罗勇浩锤完了袁舟子,也顺势宣传起了自己的英文培训班,调侃什么“打假斗士袁舟子终生质量监督”。 崔勇元骂完了袁舟子的无知,话里话外也说起自己的什么非转基因安全绿色食品。 孟繁岐看着这一出闹剧,只觉得热闹都是他们的,与自己其实没有半点关系。 面上对抗争吵的如此热闹,说到最后还是一个回马枪,又给自己的产品打起了广告。 孟繁岐哭笑不得地摇了摇头,自己这回唯一的收获就是从来不用的围脖涨了几万个粉丝。 这群粉丝热情得很,整天给自己发一大堆不着调的私信。 “学霸,能指导我写论文吗?价格好说!”这哪里是指导论文,其实就是想买论文来了。 “学霸,我能带你上分吗?我亚索贼溜!”这个是想坑人来了。 付出的代价倒是不小,这下子自己那点狐朋狗友可算是全都知道这回事了。 原本除了唐璜之外,其实他身边的人很少了解到他的近况。 “本想以普通人的身份跟你们相处,可惜现在实在是瞒不住了。我摊牌了!” 从舆论漩涡当中脱出的孟繁岐即刻卷入了另一个漩涡当中,那便是狐朋狗友们的口诛笔伐中。 “啥情况啊,这发达了不带带兄弟们?” “实在是不得了啊,这才几个月不见,就够得上围脖热搜了,长能耐了啊。” “小样儿这么能学,以前我怎么没看出来?” “顿悟,顿悟,我悟了!”孟繁岐笑着和大家插科打诨,“坎坷的生活终究是无法遮掩我耀眼的光芒。” “呕!”一群人闻言都作势要吐。 距离昨天情况澄清,热度消退已经又过去快一天了。 今天孟繁岐主动找上门来,想询问一下付院长,学校这边的事情是不是已经差不多解决。 敲门进去,却未曾想里面坐着一个有过一面之缘的人。 黑色长发,也没有刻意打理得非常顺滑,稍带一些杂乱,碎发,反而更有青春的气息。 肤色冷白,脸上总是没什么表情。韩辞此行其实便是为孟繁岐而来,但见到他推门而入,却还是没有什么反应。 “你来了?”付院长笑着起身拍了拍孟繁岐的肩膀,“昨天处理得不错,堵不如疏,能够带走热度的只有下一个更大的热度。” “事情这么顺利,我其实也没什么功劳。”孟繁岐这倒也不是谦虚,“我的法子还没等见效呢,谁能想到两位名人联手出击。” “哈哈,多行不义必自毙。他袁舟子整天在网络上咬人,如今也该受到点教训了。”付院长喜笑颜开,显然从昨天一直高兴到现在。 “两位应该多少算是认识?真要说起来,我也是因为她的话才起了兴致,去图书馆的时候才能认出你来。” “几个月见过一次,还有印象。”韩辞的记忆点还是比较足的,长相漂亮,又是少见的数理类跳级的天才女生,平时表情不多,感觉冷冷的,但不少时刻又显得有些呆萌。 就比如那天在图书馆,莫名其妙就委屈到哭鼻子了,完全不符合她平时的外表。 “反差嘛。”孟繁岐略懂种类繁多的萌点,虽然不是那么好这口,但不得不说,可爱漂亮的事物,不管是人还是动物又或者是其他什么。总是能让人心情愉悦的。 “我这位小师妹前两个月正式开始读研了,一直没有想好自己的研究课题和方向。”付院长说起自己这个差了一辈的小师妹,眉开眼笑,仿佛是自己的亲生女儿一般。 “我也跟你说过,鄂院士如今在搞大数据方面的应用数学。要说目前对大数据的利用,人工智能方向是一大片蓝海。不管是图像,语言,语音等等,都大有可为。” 听到这里,孟繁岐耳朵一竖,隐约感觉有点不妙。 果不其然,付院长很快就把他给安排上了,“那要说现在ai前沿应用方向,谁的动作最快?我想没有人会知道,竟然会是一个本科生。” “如果想要了解这方向,我想没有谁能比你更加胜任了。”付院长作为唯一看过孟繁岐未公开草稿的人,他很清楚这小子还藏了很多世界级别的ai算法应用突破。“这方面,我实在帮不上小师妹,这个艰巨的任务就交给你了!” “您老太过奖啦。”孟繁岐叹了口气,心说付院长你个浓眉大眼的,怎么也把我给卖了。就连一同参赛的唐璜,孟繁岐都没有透露太多技术和论文的情况。 唯有付院长,平日里有诸多问题请教,自然也就难以藏私。 加上其人向来以为人正派闻名,孟繁岐根本没有想过自己私藏的那部分情报会被第三个人知晓。 作为这大半年来对孟繁岐科研成果贡献极大的人,于情于理,孟繁岐都没法拒绝他的要求,即便是脏活累活也要干。 更何况孟繁岐对韩辞印象不错,毕竟谁会讨厌文静聪明的清秀姑娘呢? “既然是付院长开口,不管有什么任务,我自然是尽力而为。”孟繁岐想着,正好也放缓一下节奏,换换心情。 “你放心,我来之前已经做足了功课,不会拖你后腿,浪费你的时间的。”韩辞的声音不大,但是和她的相貌一样,非常具有灵气,让人不由自主地心生好感。 “我也是有了一些具体的想法,这才来麻烦付师兄,没想到他还没去找你,你却自己送上门来了。”韩辞用手虚遮了一下嘴巴,轻轻笑道。 孟繁岐闻言一愣,不知不觉就把这家伙跳级天才的属性给忘了。 在付院长面前他可以什么事情都虚心请教,可若是在韩辞面前,又是在自己熟悉的领域,他总还是要三分面子,有点好胜之心的。 “你这是有备而来,不讲武德来偷袭我!” 这下坏了,想要在真正的天才面前,维持学霸的人设可不太容易。孟繁岐这时候才反应过来,别说是放缓节奏换换心情,这是给哥们上强度来了啊。 第32章 意料之外 数院大楼五楼,孟繁岐和韩辞两人刚从院长办公室出来。 “请你吃顿饭。”韩辞按完电梯转过头看向孟繁岐,她觉得既然要麻烦别人,当然不能让别人白干。 “倒也不用那么客气。”孟繁岐知道她的意思,“当时若不是你跟付院长提过我的事情,想来付院长也不会在图书馆注意到我。” “他的指点对我来还是非常关键的,这份功劳怎么也得有一部分算在你的头上。”孟繁岐这个倒是真心话,如果不是付院长的帮助,他早期的这几篇论文质量肯定要下降一两个档次。 “我有功劳,那你请我吃,我饿了。”韩辞可从来不玩口是心非打太极那一套,既然对方都这么说了,她直接就是一个欣然接受。 这家伙还真不客气啊,孟繁岐心里吐槽了一句,不过不论怎么说,与这样的人相处至少非常轻松。不会有其他的想法藏着,整天让你去猜。 “当时,我只是觉得你在这方面的研究有些意思,拜访付师兄的时候说到老师相关的事情,提倡关注大数据和人工智能,就提了一句。”韩辞回忆了一下当时的情况,“我倒是没想过那个内容会是这么突破性的成果,要按我个人的看法的话,残差在数学和物理方向确实不是什么很有新意的东西。” “你倒是会说大话,太阳底下能有多少新鲜的东西?”孟繁岐知道她没有贬低自己的意思,笑着应道,“有关神经网络本身结构的内容,在ai方向其实也只是很小的部分。残差只是一种使得网络更容易被优化的小技巧,以数学界的眼光看,当然不是什么大不了的东西。” 类似残差的形式在数学界随处可见,欧拉前向,牛顿法,都含有类似的理念。 “说到底,人工智能是一个强实践性的学科。它的理论和可解释性薄弱,但性能突飞猛进,工业应用的价值很大。我觉得不管是实践派还是理论派,都需要客观认识这件事情,不要整天搞来回鄙视那一套。” 孟繁岐感觉,韩辞就已经开始有一点理论至上的味道了。“我个人认为,能够切实影响到人们的生活更加重要一些,可以感觉到自己的成果,理论这样真正基础的东西就交给你这样的天才去好好研究。” 倒也不是孟繁岐不想提前推进ai理论方面的进展,而是直到2023,ai的原理和可解释性始终没有什么进步。即便是鄂院士,在搞了一段时间的动力系统视角解释之后,做了一些理论贡献之后,也将注意力转移走了。 “得了。”韩辞翻了个白眼,“嘴上说不要搞鄙视那一套,转过头还不是说我们的研究对人的生活没有影响。” “倒不是说你的研究就一定对生活产生不了影响,只是就这个学科和方向而言,可能理论方面的成果比较难出。即便出来了,也很容易和实验结果对不上。” 孟繁岐不是轻理论重实验,而是从ai起飞以来,实在有太多的未解之谜说不出答案。传统机器学习的理论和规律失效了太多。 多少人前赴后继地跳进ai可解释性的大坑,但到最后拿出来的却大多是比较牵强的解释,有点打哪儿指哪儿的感觉。 反而是一些偏重可视化的实践工作,对理解ai模型的模式帮助很大。 “更多的是被好奇心所驱动,我当时完全没有想到你在图书馆写的那个技术会取得世界级的突破。如今知道它的价值,确实十分好奇。”韩辞其实才是这个世界上第二个知道残差网络的人,只不过她当时只粗略一读,看了一眼摘要,没有机会细读,也根本没有太放在心上。 这也正常,谁会想到自己能在图书馆撞见大幅突破世界算法性能记录的人呢? “说起来,你的drea的论文还没有公布?计划什么时候发出来?”付院长没有将孟繁岐的原稿透露给别人,但是还是和自己这位小师妹聊了不少具体的内容。 “还没,我准备到下个月去澳大利亚参会的时候,再公布出来。”孟繁岐对这件事一点也不急,他猜到付院长应该不会将自己的稿件给别人看,所以才会特意让自己来解答韩辞的一些问题。 他个人其实倒也无所谓,人工智能方向的文章,代码和实验结果大部分时候重要性和理论以及文章本身相差无几。 即便是接触过源码和大量实验的孟繁岐复现这些内容也花了大半年时间,不存在什么窃取的风险。 于是孟繁岐相当爽快地从包里将原稿拿给了韩辞。 “你就不好奇我为什么这么关注你的工作?”韩辞接过论文稿件,一边走一边快速地浏览着。 “大概就是想从drea的残差和数理的关系入手呗。”孟繁岐对理论工作关注得不多,但对鄂院士流派的一些想法还是略知一二。 知其然,不知其所以然。但在这个时间点,忽悠韩辞肯定是够够的了。 “哦?你再仔细说说?”韩辞这下是真的有些诧异了,付院长特别喜欢这个小师妹,所以跟她交流过不少。对孟繁岐的事情也有提及一二。 在两人的交流当中,韩辞的感受是,孟繁岐对人工智能方向的判断和视野很好,涉猎范围广,偏向实用技术。 代码能力很出色,自己提出的理论和算法都能够比较高性能的实现,不过理论和数学上的定义和推演,只能说是非常寻常普通的水平。 在两位着名数学院士门生的眼中,自然也就是中游之姿,没有什么特别可称道的地方。 韩辞完全承认也敬佩孟繁岐在人工智能方面的天赋,但要说到数理方面,却还真没指望过他能有什么独到的见解。 被乍一说中,韩辞有些不信,便让他继续说说看。 “动力系统视角下的残差网络应该有不少方向能做。”孟繁岐暗笑,还想考我?你老师过两年发什么论文我都知道。 第33章 一个火锅的视角 “????”韩辞不敢置信地瞪大了眼睛,她上次难得见到老师一面,仔细谈了一些内容,跟鄂院士讨论出的初步方向,就连付院长也没有告诉。 却被这个数理水平相当一般的家伙直接就猜中了七八成?? 孟繁岐一看这个表情就知道这姑娘在想什么,“哥们数理学得一般,但这残差的想法,和相关的实验可切切实实都是我做的呀。真就当我什么都不懂呗?” “这么懂?真的假的。”平心而论,韩辞不是没有见过和自己同龄的天才。 但这种东西,其实最要命的是预期和实际的反差所带来的新鲜感。倘若这话是同为数学天才的人说出,那就没什么意思,即便是未成年人,韩辞都不会惊讶什么。 偏偏从孟繁岐这个数学物理水平都很一般的人口中听到了如此准确的猜测,韩辞很难不开始对这个人产生好奇。 “那么,孟大作者,说说你的想法呗。”韩辞转念一想,这倒也是好事。虽然他不大懂,但作为作者,他的理解自然会比绝大多数人都深刻独到。 既然他能猜到自己的想法,不如看看他到底有何高见。 “这个视角就是把整个网络看成一个动力系统嘛。都说神经网络是黑盒,谁也搞不清楚里面到底做了什么。”孟繁岐回忆了一下,鄂维南院士在这方面的主要观点就是从动力系统的视角出发。 “这么看待问题的话,可以把很多网络结构的设计归纳进来,算是一个海纳百川的思路。你们从这个角度出发,就可以把我的残差思想归纳为理论下的一个小分支。”孟繁岐笑道。 自己这次的创举,看来也使得鄂院士开始提前关注这方面的问题,更早提出了相关的猜测和想法。 “动力系统是一个桥梁,通过你的残差思想和动力系统状态的等价性,就可以引入很多数学和物理界的概念来解释许多现象。”韩辞倒没有想什么要把别人的方法归纳进来。 她更多的是好奇,为什么这种方法的威力如此强大,连续两年大幅的性能提升,几乎已经赶超过去小几十年的进步幅度了。 “往前推,可以解释很多问题和现象,往后推呢,可以依据理论来设计网络,多贪心呢。只不过神经网络中涉及到很多维度的反复变换,如果纯粹用这种方式去解答,还是只能停留在玩具级别的网络和数据上。” “倒也是一旦设计多次维度的反复变换,分析就完全不好做了。” “遮挡在深度学习天空上的乌云已经被我拨开,遮挡在可解释理论上的乌云就要靠你喽。”孟繁岐这话除了玩笑的成分,倒也算得上是真诚的祝福。 领着韩辞来到学校附近的一个小商场。 北五环外,消费档次想上也上不去,“想吃什么,随便看随便选。” 一挥手,真也不是阔气,这地方上限也就那样了。 “吃火锅。”韩辞扫了一圈商场门口的餐厅,感觉也没什么特别的。“这冰冷的天气,寒风刺骨,唯有这火锅还有些温度。” “韩风辞骨是,我发现你名字和本人其实骨子里都沾点文艺的感觉,是不是当初想当文学少女来着?” “算是,就是可惜了,没什么天分。”韩辞撇撇嘴,“人生么,不如意者十有八九,早习惯了。” “真能贫啊。”没接触多久,这姑娘的话就多了起来,看来也是个外冷内热的家伙,孟繁岐笑道,“平时干嘛那么冷冰冰的,端着不累啊?” “不是端着,而是大多数时候确实对别的事情不感兴趣。别人喜欢的我不懂,我说的他们也不懂。如果本就不同,又何必强行融入呢?” 韩辞摇了摇头,她主要是不觉得有必要浪费这个时间。“我其实觉得,非要按别人觉得好,觉得正常的方式活着,那才是端着。你自己又不想,偏偏又要勉强自己去做,这不是端着什么是端着?” 说到这里,服务员正好端着锅底上来。 韩辞指了指离去服务员的背影,说道,“只有这种端着才有点意义。” 孟繁岐原本只觉得这姑娘冷冰冰的,虽然清秀好看,但总给人那种只可远观的感觉。现在看她一本正经地瞎扯,突然觉得特别有意思。 自回来之后,其实自己没有过到什么校园生活。只在学校呆了没几天,就急着翘课蹲在图书馆和出租屋里忙着这些算法的准备和实现。 如今这种感觉,这才有点青春的味道。 孟繁岐回想起前世的这大半年时光,他当时正忙着追一个隔壁院的学姐呢。 学姐大自己两届,马上本科毕业了,直接一口回绝了孟繁岐。 但他偏不信邪,整天早起给人去食堂买早餐,迎来送往的,经常在宿舍楼附近蹲着。 “年少无知的小男生,总是爱做舔狗。”孟繁岐回忆了一番,感觉甚是唏嘘。 当年费了老劲,非要把人追到手,到头来其实也没有相处几天。那位学姐要论相貌的话,比眼前这位还是差上两个档次。 可自己两次见到韩辞,今天还单独出来吃饭聊天,竟然自始至终完全没有动过什么念头。 “可能这就是事业心。”孟繁岐在心中默默为自己点赞,“女朋友什么的,只会减慢我写代码的速度!” “想什么呢?还不快吃?”就在孟繁岐愣神的时候,韩辞已经在下毛肚了,七上八下,手法很是标准,“老儿北儿京儿二八酱儿,这叫一个地道儿。” 听着韩辞拙劣的bj腔和儿化音,孟繁岐终于是没憋住,笑出了声来。 韩辞却一脸无辜地看着他,似乎完全不明白这有什么好笑的。 “所以说,人其实就有点像火锅食材。”孟繁岐又捡起前面的话题,“见到别的食材作料都往里下,自己也不是不能下去煮,就是煮得久了,未必就好吃。” “这话说得有点意思了。”韩辞说着已经快下完半盘毛肚了,“我就像这毛肚,跟其他食材烫不到一起去,倒也不必非要去凑什么热闹,这毛肚还是早点出锅,嫩点好吃。非要和其他食材一起扎堆,烫老了也就没人爱吃了。” 第34章 没有理由 “?女孩子拿什么比喻自己不好,非要当毛肚?”孟繁岐感觉有些好笑,这年头听到的比喻真是越来越稀奇古怪了。 “不过你说的倒也有点意思,不论是一定要和别人一样,还是一定要和别人不一样,其实上都是挺别扭的一件事情。”孟繁岐回忆了一下自己小学时候的一件趣事。 “我对小学的一个场景印象很深,一群小屁孩在班会上说自己以后长大了想做什么。那时候的愿望还显得朴素一点,班级人共一石,科学家独占八斗。” “那么小的年纪,我就已经能感觉到有点不对劲了,怎么一个班出这么多科学家,搞得像是来批发进货一样。我本来也想说自己要做科学家,但看大家都这么说,总觉得心里有点不痛快。” 这话说得倒挺真实的,韩辞闻言哈哈大笑,“这就说明大部分时候,我们真实想要的东西,和嘴上说的其实还是有很大的偏差。只是有的人是不愿意承认,有的人则是没有注意到。” “我可能就是单纯的有一种心态,如果别人也想要我想要的东西,就感到非常不快。但很长一段时间,我都不愿意承认这件事,因为它好像会显得我非常小气。” 孟繁岐还是挺佩服韩辞的,因为人总是会缺乏承认的勇气,其理由往往也千奇百怪。 “人如果能够忠于自己所知到的所有事实,可以称作坦率,反之,若不忠于所知的事实便是虚伪。而大多数人则只忠于经过自己主观筛选的事实,拒绝承认另外的部分,这就会导致痛苦。” “总得来说,你是个还算坦率的人,程度一般,但在这个世界已经显得有些难得了。”韩辞艰难地把一个牛丸夹了起来,放进嘴里。不慎被汤汁烫得嗷嗷乱叫。 拿过一旁的酸梅汤灌了一口,韩辞表现得像是刚刚什么事情都没有发生一般,伸出手道,“很高兴真正意义上认识了你。” 孟繁岐哭笑不得地伸出手握了握,“敢情现在才是真的认识,刚才都是逢场作戏?” “这不是挺正常的,别说认识别人了,很多人二三十岁了还算不上真的认识自己呢。”韩辞不以为然地回应道,“行尸走肉罢了。” “小小年纪,哪儿学的这么多大道理,说得像是历尽沧桑一样。”孟繁岐听着觉得有些好笑,“有没有一种可能,生活就是被人刻意营造成一种忙碌而紧凑的节奏的。” “每天忙得像死狗,回家瘫得像死猪。哪儿还有心情去想哲学问题,还认识自己呢。你倒是认识自己了,谁认识你啊。”孟繁岐心想道,小丫头片子,打过工吗?到时候不给你拉满了当牛马。 “做到这件事情,总还是会轻松一点的。”韩辞倒也不是不知道很多人的辛苦,“认识自己,重视自己,才更有可能找到自己幸福的方式和途径。” “事业也好,爱情也好,都是这样的。如果总是想着要和别人一样,又或者是不一样。其实都是完全以别人的看法来影响自己的生活。”在韩辞看来,通过别人的态度和想法来决定自己的选择,这是非常愚蠢的事情。 “别人的想法和态度,往往总是与你的期望有所出入。而妄图用种种办法去改变别人的想法,其实就是在图谋自己根本没法得到的东西,这是人这一生最大的痛苦之源,也是最大的自私。” 韩辞说这些话的时候,还是挺认真的,不过她随即举例道,“我现在就说你是蠢猪,你又能有什么办法。如果总想着要改变我,未免太浪费时间了一点,根本毫无意义。” “哈哈哈。”孟繁岐听了也没有在意,他倒是觉得这个例子举得相当可爱,尤其是韩辞在思索侮辱性词汇的时候。 似乎还绞尽脑汁,想了一小会,最后也只是自以为恶狠狠,实际上可可爱爱地说了一句蠢猪。 “你说的话让我想起自己看过的一个故事。说唐朝有位才子叫做李赤,才学过人,是一位翩翩佳公子。 这位才子什么都好,唯有一个癖好怪得很,那就是喜欢一头扎进粪桶里去。 有次大家一起去吃饭,李先生中途离席上厕所,一去再也不回。 半晌,众人觉得奇怪就去查探,结果发现李先生大头朝下,在粪桶里拿大顶。 这可把大伙给吓坏了,心说一定是有奸人谋害李先生。 李先生坦然相告,说的确是我自己扎进去的,众人也不以为意,只当他在说笑。” “哈哈哈哈!!”韩辞猛地听到粪桶里在拿大顶,也不在意自己正在吃东西,只觉得这件事听起来莫名地喜感,异常有趣。 笑完之后,她大概也理解了孟繁岐想表达什么。借这个荒谬的故事,他想说的是,人的许多选择其实是相当荒谬或者无意识的。 如果有人不理解,那很正常。如果有人非要一个解释,那未必管得也太宽了一点,你又算是老几,非要别人给你解释什么。 何以任何的事情都需要有个理由,人想做什么事情,愿做什么事情,难不成非得说出个理所当然来吗? “要我说的话,人的大多数行为都是没有理由的,有理由的那部分则大多见不得人,说不出口。但凡做哪些事情的理由能公之于众,恨不得抓着人就要说一下,其实反而是一件值得小心的事情。” 韩辞嘴里吃着东西,嘟嘟囔囔地说道。 “我个人可能庸俗点,觉得吃好点,赚多点,健康点总是好的。我自然还是狠不下心来去粪桶里拿大顶,但要是有人真的爱这样,我也不会去鄙视他教育他,当然前提是他别把粪桶扣我头上。” “就算情况再极端点,这位李先生这回选了个深点的粪桶,一头扎里面不小心憋死了。只要他还带着幸福的微笑,我觉得旁人也没有什么可以指责的。” “哈哈哈!”这次轮到孟繁岐哈哈大笑,这家伙吐槽之余带着点怂怂的感觉,你别说,确实还挺可爱的。 第35章 这世界真小 “我这些年来总能看到很多人嘴上为别人好,但实际上想尽办法让别人过得不舒服,单听他们的说辞似乎个个都做了不得了的牺牲。 若让他们少费点心先把自己的日子过好,他们还不乐意。可以想象,若是他们看到了李先生一头扎进粪桶,一定会对他做上一整天的思想教育。” 孟繁岐这番话让韩辞感觉特别有共鸣,“这件事我也觉得挺奇怪的。每个人都非要为别人好不可,但到头来却不见得有多少好处真的落在大家的头上。” “或许我甚至没有权力拒绝为别人做些什么,但我至少总得要保有拒绝接受别人‘帮助’的权力。”韩辞说这句话的时候好像若有所思的样子。 孟繁岐大概也听出了,这家伙估计是回想起了自己的什么个人经历。 天才也是不好当的,只是外人关注的往往只是他们专业途径上的成就,对于个人的情感和生活上来说,其实很少有那种一路上都走得很舒服的天才。 孩子展现出了天赋,很容易被家长搞成填鸭式教学,毕竟就算天赋再好,没有长辈的正确引导,也很难走在正确的道路之上。 个人的情感经历方面,相比之下受到的关注很容易不充分。 “杀伤力最大的应该就是,‘我是为你好’了。”孟繁岐稍稍把话题往那个方向偏了一点,算是小小的试探,“就好像他们的目的是对的,就能够证明自己行为也是对的。” 说完之后,就发觉韩辞似笑非笑地看着自己,她不回应,不说话,但也显然没有生气动怒。 只用自己的眼神在回应,半晌,孟繁岐讪讪的移开了自己的视线,这丫头似乎直接就发觉了自己的目的。 又顿了几秒钟后,韩辞突然挑了挑眉,与这件事没什么关联。 而是她突然之间好像发现了一个熟悉的身影出现在店外面。 “我好像看到熟人了。”韩辞侧过头,又仔细分辨了一会儿,这才轻轻说道。 孟繁岐注意到她的视线看向的是自己身后的店外,循着这个方向望去,却不曾想他竟然也看到了自己无比熟悉的身影,而且还是三个。 不禁感叹,“这个世界可真小啊。” 只是此时的两人都还不知道,他们的熟人竟是同一批人。 归来之后的孟繁岐,过去的半年多时间内还是很拼的。几乎淡出了同学,乃至同宿舍几人的视野当中。 休学之后的情况更甚,整日里时间大都在图书馆,数院院长室和自己的出租屋内。 唐璜起初跟着孟繁岐恶补了一段时间的相关知识,两人同行了不短的时间,但后来他对技术和代码有了一定的了解之后,一同行动的时间倒也不那么多了。 尤其休学之后整天无事,竞赛后来也有了一个远远出乎唐璜意料的好结果。 唐璜原本最苦恼的事情,就是申请留学的履历和材料内容不够好,如今问题一下子得到了解决。 即便是对于硕博生而言,作为这个比赛的冠军队伍成员,也已经算是比较出色的经历之一了。 更何况他如今还只是一个本科生? 不再苦恼申请问题的唐璜,顿觉无事一身轻,近日里便有些游手好闲起来,整日忙于和熟悉的朋友相聚,吃喝玩乐。 毕竟还是个本科生啊,这时候能够想到以后专业和就业的问题,有这个警觉性已经不错了。孟繁岐远远地看着唐璜,心里其实觉得有些羡慕。 这种纯粹而无忧无虑的心态是一种消耗品,一旦失去,就很难再次获得了。 而此刻和孟繁岐两个室友,唐璜和刘旭一同的,是小他们一届的两位学妹,麦芒与秦慧。 这其中,麦芒和唐璜算是旧识。初中时期,虽非同校,但曾在同一处地方打过几年乒乓。 秦慧与刘旭倒是出自同一所高中,只是不同年级,彼时未曾有过任何的接触和联络。 如今到了燕京的高校里来,似乎这一点点微薄的缘分和共同经历突然就显得弥足珍贵,两人的关系一下子显得近了许多。 四人今天早些时候分作两批,各自行动,方才也是刚刚汇合不久。 唐璜与麦芒都是有些自来熟的外向性格,刘旭,秦慧稍稍内敛一些,但熟起来之后话也不少。 “秦慧这是什么倒霉名字,以后等什么时节拍岳飞的剧,火起来了,肯定有人要抓着你背满江红。”几十分钟的时间,已经足够年轻人们彼此之间熟悉热络起来。 “你们叫我慧慧就好。”秦慧小脸一红,她至今也搞不明白为什么父母要给自己起一个这样谐音秦桧的名字。 “得了你,唐璜就算是什么好名字了?”麦芒刚准备对唐璜重拳出击,维护自己的小姐妹。 相比韩辞注意到这边的几人的时间没差太久,麦芒也不经意之间发现了店内的熟悉面孔,“等下,我好像看到韩姐了。” “韩姐?就是你以前经常提到过的那个韩辞?”唐璜回忆了一下,当年一起打乒乓的时候,麦芒确实经常提到过这么一个人。 其实通常来说,唐璜的记性并没有这么好,能够记得韩辞这个人,只是因为那段时间,事情的发展确实有些好笑。 当时唐璜读初三,麦芒读初一,韩辞也读初一。一切都很正常。 一起打了三个月的球,事情开始有点不对劲了,唐璜读初三,麦芒读初一,韩辞跑去读初二了。 等到下半学期,唐璜读初三下,麦芒读初一下,韩辞也跑来读初三下。 好家伙,唐璜本来还以为韩辞会跟自己同一届参加中考,结果人家直接保送走了,提前去了高中旁听。一年更比三年强。 相比于只存在于传说中的绝世天才们,韩辞显然是唐璜生活在当中所听到的最为天才之人。 距离感一下子就小了不少。 “走哇,带我们看看去,认识一下。”只活在传说中的人物如今就在自己面前,唐璜一下子来了兴趣,“都说百闻不如一见,人在哪儿呢?快快,指给我看看。这么多年前就听你说过了,一直还没见过。” “喏。那边两人小桌,脸正对着我们的就是。” 唐璜顺着麦芒的手指望去,正好迎上孟繁岐的视线。 第36章 一个邀请 “看什么看,有什么好看的。”既然已经对上视线,孟繁岐便勾了勾手,招呼几人过来。“来了就一起吃呗。” “方便吗?”唐璜紧赶慢赶,往前凑了几步,这才大概看清楚情况。 这几个月孟繁岐的情况他最清楚,按理说应该不是什么约会。 不过该问的还是要问,这句话倒也不是问孟繁岐,而是在询问韩辞。 “来,我们也没吃多久。”,韩辞原本也打算晚些时候去找麦芒的,只是没想到如今两件事合并成了一件。 “服务员,这边我们自己拉张台子并过来,请问方便的?”唐璜和刘旭两人张罗桌子的事情去了。 麦芒则是一见面就往韩辞身上蹭,“韩姐,大学的课程可真要命啊,我才学了一年,皮都掉了一层了。我记得你上次跟我说你都要读研了,怎么样,还算顺利吗?要我说你还读什么研究生呀,浪费时间,直博不就好了!” 麦芒见到韩辞就像是见着亲人了,一张嘴就像连珠炮一样,说个不停,这倒也情有可原。麦芒的智慧不能算作是笨猪,但初中高中的学业对她来说可是相当不轻松的。 如果不是很早就认识了韩辞,又一直和她的关系相处得这么好。少了韩辞那六七年的帮助,麦芒自认为燕京电力大学这个算是中游水准的211跟她多半是没什么缘分的。 大部分人终究是善妒的,身边如果有韩辞这样,相貌,智慧,家境都胜过自己的人,其实还是很难真心相处的。 虽然说韩辞优秀过了头,对许多人来说反而升不起嫉妒之心。 但有时候未必就非要去针对这样的人,选择敬而远之的人其实不少。 而麦芒则能够非常纯粹地跟韩辞交朋友,这点其实殊为难得。 “大部分人其实还是很容易见不得别人比自己过得好的,尤其是那些你身边的人,你亲近的人。”孟繁岐在心中默默想道,“或者说,他们希望你过得好,但最好还是不要比他们自己更好。” 能够纯粹地为朋友而感到开心的人还是挺难得的,孟繁岐觉得,比起理塘的王,纯真丁一郎。麦芒这样的人才算得上是真的纯真。 上回初见的时候,麦芒来将韩辞领走,孟繁岐依稀还记得这件事情。只是他却没想到,麦芒竟然还与自己的室友认识。 仔细回忆了一下往事,实在也没什么印象。 等这四人在旁边拉来一张大点的桌子拼了起来,落座聊了两句,这才清楚,原来也是些不远不近的旧识。 “博士不是课程,不是好好学了,做做题就能够读完的。”韩辞揪了揪麦芒的鼻子,随后双管齐下,双手把她的脸蛋捏扁搓圆,像是在揉一个大面团。 “我做做题还算是有一手,但要说到研究,其实我心里也是一点底气都没有。”韩辞这倒也不是假话,初中高中和本科,只要题目作对,分数考高,学分修够。那肯定是顺顺利利,没有什么变数。 “硕博的毕业方式主要还是看论文和研究成果,其实很多时候根本由不得你。”孟繁在这里插了一句,收获了韩辞一个巨大的白眼。 “是哇,谁能像你这样,论文说写就写,半年生产七八篇呢?”说不羡慕,那是假的。论文对韩辞来说是全新的领域,看到同龄人能够比自己做得更好,其实是她非常不熟悉的情况。 这也是上次她在图书馆看到word崩溃,情绪也有些崩溃的原因。因为一般来说,她总是最好的那一个,她已经习惯了。 “实验报告罢了,我们这就是纯纯的苦力活,这个方向和数理方向的难度没法比。”孟繁岐示敌以弱,韩辞也不再追击。 “我还是第一次和重量级学霸同桌吃饭呢。”秦慧的声音柔柔弱弱的,“而且还是两位,我今年的积点至少能往上涨个05。” “哇!慧慧你是不知道,就因为他休了学,前两天还上了热搜呢。”麦芒平时高强度冲浪,对这些情报如数家珍。 “围脖上都闹翻天啦。我还看到很多消息,说有不少国内科技巨头要高薪聘请你!”麦芒说起这个,来了劲了,“是真的还是假的!我看好几个版本,都在传什么阿狸给天才少年开出百万年薪。真要能拿百万,你还会继续读书吗?” “要是我的话,我肯定不读了。”麦芒掰起手指盘算了一下,“我一年才花小几万块钱,只要有一两百万存在银行,每年利息都够我吃得饱饱得了。” 听到麦芒突然就开始问薪水,韩辞直接在桌下面拍了麦芒大腿一下,颦着眉头看了她一眼。 麦芒这才意识到自己问的事情可能有些敏感,吐了吐舌头不再继续说下去。 问薪水在社会或者职场里其实是很大的忌讳,许多公司都不允许职员之间交流待遇相关的信息。 情报外泄的,没入职的取消offer,入职的通常也会被约谈,严重的情况下,直接开除也不是没有可能。 不过孟繁岐清楚,这个家伙单纯就是讲话不过脑子,想到什么就说什么,没有什么其他的意思。 他本不想细说这方面的事情,毕竟学历和收入是衡量学生和社会人这两个身份最简单粗暴的指标。 一个数字说出来,难免会有对比的感觉。 不过既然问了,孟繁岐突然有了一个其他的想法,想要进行一个邀请,于是便准备透露一些情况做铺垫。 “阿狸那个百万offer纯纯的假情报了,他们就只有一个人力总监给我打了个电话,问我80万一年去不去。”孟繁岐说起这件事就觉得有些好笑,不明白为什么阿狸的人力会那么趾高气昂。 一个搞人力资源的,技术么懂又不懂,也不知道哪里搞来的电话号码,直接打到了孟繁岐的手机上。 婉拒之后,还再三重复什么,“你拒绝的是阿狸哦”,“阿狸这样的公司可不是随时想去都可以去的”,“你一个本科生,给你开80万一年,真的不少了,不要不识抬举”。 孟繁岐本想体面地结束那次对话,但最终实在被复读得有些无语,只能直接把电话挂了。 第37章 嘌呤半升 虽然围脖上网传的,阿狸给出百万年薪的流言被孟繁岐本人答复为假情报。 但80万这个数字仍旧对在场的几位大学生拥有着很大的冲击力。 八十万他们都不由得在想,如果自己毕业就业,到底能拿到多少的年薪。 对于几位本科才读了一半的普通大学生而言,超过五十万的数字其实已经很难让他们感觉到什么区别了。 八十万也好,一百万也好,一个亿也好。反正都是很多很多钱,自己怎么也拿不到的数目。 在场的几人,也就只有唐璜看过孟繁岐的谷歌offer,因此听到80万显得非常镇定。 “这才几个钱?都不够谷歌签字费的零头!” 这小子当时怎么也不敢相信,把10,000,000这个数字愣是数了十几遍。 孟繁岐看着都觉得好笑,“人家数字上每隔三个给你打个逗号,不就是方便你数数的吗?有这么难数吗?” 唐璜不知如何应对,只是不死心又问道,“他们是不是多打了一个0?或者两个0?” 孟繁岐顿时觉得无语。“数字可能打错,旁边的ten illions怎么解释呢。” “额” 过了好一会儿,唐璜总算消化了这个事实,只见他二话不说,起身便拜。 “唐璜,飘零半生,只恨未逢明主。公若不弃,璜愿拜为义父。 义父在上,儿从此后跟定义父。赴汤蹈火,在所不辞。相助义父,共图大业!” 这才只是起步的阶段,还没有接触到谷歌的平台,孟繁岐就已经拿到这样的天文数字。 唐璜认为以后的事情已经不言而喻了。 和自己一起组一台电脑,这样的简陋小作坊就能出世界级的成果,加入谷歌后那还得了? 自己一定要狠狠抱住这根粗壮的大腿,别说是一千万美金了,就算是十分之一,百分之一,唐璜也已经心满意足。 “爬,把我当董卓了是。” 孟繁岐骂归骂,但他也的确有意开始逐渐建立一个自己比较熟悉的小团队。 对于ai方向的算法和技术突破来说,他自己一个人就够了。身边的人是没法帮得上忙的。 凭借重生的优势,他借助谷歌平台,已经足以在2-3年内将日后最重要的技术和论文尽数收入囊中。 以后合作也是会和各大机构或者各大院校去合作,倒是不指望从身边去找懂技术的人。 不过,再等个几个月左右的时间,孟繁岐已经有了计划先在视觉算法方向进行突破和创业。 原本很多人脸识别和检测的方法,15年就已经普及并投入使用了。 尤其像刷脸支付,各种公务的刷脸确认等等,这会是早期视觉项目中落地最为广泛,也最为实用的技术。 孟繁岐除了已经准备好的那篇检测论文之外,接下来一段时间内的重心,就是连续将人脸或者其他内容检测相关的视觉算法进行突破。 不管是识别精度还是识别速度,他都很有把握再提升一大截。 往后,在美国的一些事务基本会由自己主持解决。 但国内毕竟还是相对独立的一个市场,想要在中国大陆分一杯羹,往往还是需要和国内的一些龙头协作。 像谷歌这样的国际大厂,手并不方便伸进来。 如此一来,确实也需要几位信得过的朋友帮自己盯一下,一些具体的事宜。 技术倒不需要懂多少,只要人比较知根知底,信得过就好。 “八十万,一百万听起来很多,但对一个新兴的技术方向来说,只是一个很小的数目。”孟繁岐之所以选择透露一些薪资待遇的消息,就是希望借此吸引几人加入。 “道理是这么个道理,但我们几个就算知道这个技术方向,好像也没有那个资格入场分一杯羹。”秦慧其实很清楚,自己够不够格入场赚这个方向的钱,全看眼前这个人愿不愿意带她。 只是刚才聊天中也了解到,唐璜和刘旭是孟繁岐的室友,三人也算是两年的同住情谊了。如今孟繁岐有了成果,想带上两个相熟的好友,非常正常。 可自己与麦芒今天才刚刚认识他,即便和他的两位室友有点旧识,但也说不上是多亲密的关系。 她有自知之明,觉得自己很难入场分这个钱。 “你们不要觉得我说话难听,或者太过自傲,目中无人。”孟繁岐当然听出了秦慧话里的试探意味,他觉得,在这件事情上,自己的表态需要强势一些。 “就我目前对ai方向技术的掌握程度,我想让谁分一杯羹,谁就一定可以分到。” “能赚的钱有很多,我一个人实在忙不过来,所以说到底这也是一件合作共赢的事情。”孟繁岐这句话倒是实话,一点也没有掺假。 ai崛起的这些年,别说是真的搞技术的,光只是炒作概念做ppt的,都有不少人赚得盆满钵满。他自己一个人的确赚不完那么多钱。 “实不相瞒,我和唐璜已经计划借这次比赛的成绩,转向美国加州的高校,几个月后就会动身。短期内我就有一些创业的计划,但我的重心毕竟会是在硅谷那边。” “国内其实在这方面很多公司也即将开始起步,机会还是蛮多的。可这边的事情,我今后有心插手,却鞭长莫及。很多合作的事情毕竟还是要去现场谈,所以我需要的是一些人在国内的代言人。” “如果能参与的话,我们当然是很愿意做的。”麦芒主要担忧的不是关系亲疏,而是自己到底有没有那个能力去做,“我前些天在围脖上也看了一点,都是高新的技术内容,我们不懂的话,恐怕也帮不到你什么。” “这个你们倒可以放心,最关键的技术内容和指标我会直接和国内的厂商谈。具体你们实施起来的时候,也会招相应的技术人员。我只是需要少部分熟悉的人帮我看住这些公司罢了。” 倒不是说职业的经理人和管理人员不可靠,这些人他自然会招,而是同时有熟悉的人盯着,总归更放心些。 “你这个饼是不是画得太大了一点。”刘旭笑道,他和孟繁岐关系极好,倒不担心什么配不配,能不能搭上车的问题。反而比较在意,这些所谓的公司到底能不能办起来。 第38章 你这燕国地图可真长啊 “真要是如你所说,有许多方向可以开拓,我们肯定鞍前马后,为你效劳。只怕是根本没有这么多事情要做,也没有你说的那么多市场。” 其实此时,除了唐璜外的几人还是觉得,重金聘请的也是孟繁岐这一位技术精英罢了。真要说产业,公司什么的,还是太遥远了。 “无妨,我今天也只是一个提议,也不是要诸位非要做什么决定,当场签下合同什么的。” 孟繁岐本也没打算今天就把事情办得多妥当,和两位室友倒还好。一上来要拉着几个认识没太久的小姑娘给自己打工,对方有所顾虑才是正常的。 “下个月我和唐璜要去澳大利亚参会,介绍这次夺冠的算法。如果你们真的有意了解,可以和我们一同去看看。” 这次的ia竞赛是计算机视觉顶级会议iv内下属的研讨会。作为三大计算机视觉顶会之一,各名校各科技机构都有很多的人力物力投入在这里。 让几人来会场看看,其实胜过其他人的千言万语。自己感受一下,了解一下,自然也就明白孟繁岐所言非虚。 “当然啦,来回的机票酒店生活费用都不用你们来负责,这点大可以放心。”说起工作相关的事情,孟繁岐的思绪又回到了前世工作的时候,险些忘了眼前的几个人还都只是穷学生,便出言补充道。 “一个人来回机票酒店少说一两万这会不会太”即便是神经比较大条的麦芒也觉得有些不好意思。 “我们夺冠的队伍有招待名额的,其他队伍都是五人十人的规模,但我们只有两人。因此还空余了一些参会额度,这些东西当然都是会由主办方来招待的。”唐璜看了孟繁岐一眼,出声解释道。 这当然是子虚乌有的屁话,主办方确实会对参赛队伍有优待,但却也不至于会到这种管家的地步。 报销个酒店也就算了,来回机票和这期间的生活费用也给你报销?做慈善啊? 实际上想参加学术会议还是要交钱的呢!不少低水平的会议根本就不关注学术,只求你们多来些人,他们好按人头收钱,就是为了这点钱办的这个会。 只不过唐璜早已了解到孟繁岐如今准备签谷歌,签字费都能是千万美金,出这点钱自然是小意思。 既然兄弟愿意出钱,唐璜看到麦芒因为花销的问题犹豫,便把锅推给赛事的主办方。 这么说其实大部分人未必真的会信,但信不信是一回事,事情好不好做就是另一回事了。 唐璜的话,也只是给了其余几人一个坦然受之的借口和理由罢了。 场中话题变化得有些太快,韩辞感觉人有点晕了。 聊了些往事之后,自从麦芒问起薪资待遇,似乎话题就突然现实了起来,并且节奏陡然加快。 突然就到了邀约,要请客几人十二月一同前往澳大利亚参会。 唐璜刚刚接的鬼话,骗骗别人还行,说话前后的那小眼神早就被韩辞看在眼里了。 让请一顿火锅没什么,但若要让别人包吃包住请自己去旅游,未免脸皮太厚了一些。 不过此时,很显然的,麦芒已经意动了。 上学多累啊,哪有出去玩好玩! 只是这件事是孟繁岐提出的,麦芒毕竟和他不够熟悉。鉴于原本是韩辞在与他同行,麦芒也不好意思越过韩辞表示想去。 便只能眼巴巴地盯着韩辞看。 韩辞狠狠瞪了她一眼,那眼神的意思是,“你怎么什么好处都好意思要呢?!” 旋即,转过头来说道,“你和唐璜都已经不是在读的状态了,我们其他人还是学生,十二月份已经临近期末了。这时候跑到澳大利亚去,未免有些不大合适。” “大一大二的课程能有什么要紧的,反正去了也不听。”唐璜大手一挥,“搞什么形式主义,没事,麦芒,你家长那边我来搞定。” 麦芒的父亲当时就在乒乓队执教,唐璜跟麦叔叔混得很熟。 “好耶!”麦芒一蹦三尺高,有唐璜做主,她也不装了。 “学校的假期”韩辞还不死心。 “没事,我会拜托付院长帮忙联络一下,批一下假条。”孟繁岐看着韩辞绞尽脑汁找理由的样子,在心里暗笑,“毕竟这次名义上也是燕京电力大学队,也是为校争光的事情。我想老师们会理解的。” “韩姐,你去吗?”麦芒扯了扯韩辞的衣角,小心翼翼地问道。 虽然麦芒完全不大清楚为什么,但好像韩辞有点不高兴的样子。 “我才不去,我去做什么。”韩辞的理由总是被孟繁岐与唐璜二人截断,声音里带了三分嗔怒。 “那个是学术会议,你去当然是分享你的学术成果啊。”孟繁岐这次邀约的铺垫可以说是真够足的,直到此时才显露出自己的真实目的。 “我去是分享残差相关算法技术的,你不是正好对它的原理和可解释性做了一些研究吗。”孟繁岐仿佛在说一件十分理所应当的事情。 “它们完全可以放在一起展示,我介绍完了结构和实现之后,你谈一谈理论的部分。当然了,前提是你这一个月的时间内能把相关的理论给做完。” “在这等着我呢是?”韩辞冰雪聪明,听到这里哪里还不明白。前面什么需要人在国内帮忙也好,请客几位去澳大利亚参会也好。 虽然说不上是假话,但也有三分醉翁之意不在酒的味道。 “你难道就不想借此机会把你的成果放在最适合它的平台上展示吗?”孟繁岐不正面回应韩辞,而是问了她一个非常灵魂的问题。 并不是所有的论文都会有人去看,即便是好的论文也是如此。 硕博生们对待自己论文的心态,其实和网文作者对待他们的小说一样,终究还是希望拥有读者,或者得到认可的。 而一个针对drea残差思想的研究和理论探索,还能够找到比“与drea同时同台在同一个报告中展示”更具有关注度,更具有历史意义的场合吗? 尤其这次报告还是drea吊足了全世界胃口一整个月后,在世界面前首次掀开自己神秘面纱的首秀。 “我我想去。”在场的人只有韩辞知道,让自己同台汇报这个成果是多大的一份礼物。她有些无奈地嘟囔道,“你这燕国地图可真够长的” 第39章 李彦弘来电 在几人聊天相熟,有些玩笑性质地说起创业话题的同时。 就在不远处几公里外的位置,有一位相貌还算英俊,西裤白衬衫,打扮十分干练简洁的中年男子刚刚回到了自己的ceo办公室。 如果要说创业,这位互联网前辈可以说是其中翘楚了,真正的白手起家,凭借自己的超链技术融到第一笔钱的技术创业者。 虽说白度后来的搜索,文库,贴等功能和产品都把一手的好牌打得稀烂。 但只说2000年左右,那份辞去华尔街和硅谷工作,归国只身创业的毅力和眼界,那的确是万里挑一的。 李彦弘做事情讲究谋定而后动,很少会一时兴起。 2000年创立白度之前,他耗时了五年,每年都回国仔细考察国内的互联网情况和环境。 不管是后来专注独立搜索引擎网站,在美上市,还是提出框计算理念,退出数据和应用开放平台,都是他深思熟虑,反复考量的结果。 今年年初,李彦弘成立白度深度学习研究院,将ai的地位提升为公司需要创新发展的核心技术,虽然在国内所有厂家内是第一个,但其实也已经是他考察了两年多的结果了。 早在2012年,国内所有大厂还对ai相关的技术持怀疑态度的时候,白度已经在语音识别和图像识别上验证了ai算法的效果。 “ai相关的算法和技术,一定会对我们的各个技术领域产生巨大的价值。”李彦弘仔细阅读了白度团队呈现上来的结果之后,坚定地做了这个判断。 “白度有算法能力,有搜索和检索的坚实技术基础,又具备海量的大数据和强力的计算平台。这些东西都是ai最需要的,可以说,白度有天时地利人和!” “我们势必要建成世界顶尖的ai研究院!” 随着李彦弘振作士气的口号声,华国的首个ai研究中心在13年1月成立。 可接近一年的时间过去,研究院目前的情况和进展,李彦弘却不是非常满意。 他将自己的老板椅放平,躺在上面闭目养神。 眉头却不自由自主地皱了起来。 似乎自己也感受到了这点,李彦弘左手轻轻地揉捏着自己的鼻梁上方,双眼之间的位置。 虽然有所缓解,但始终还是不能解决他内心若有若无的担忧。 “研究院的成果不能说是不好,但每年都完全赶不上国际上新的突破。”李彦弘长出了一口气,感到有些疲倦。 扪心自问,他觉得自己在这个方向启动早,投入大。 怎么每年都跟见了鬼一样,总有离谱夸张的技术突破,远远甩开白度的成果呢? 去年是alex,自己豪掷两个亿人民币的报价,仍旧没能在谷歌手里争取到hton团队。 今年倒好些,是个不知名的华国学生,甚至其学校,燕京电力大学,就在白度燕京总部附近。 可偏偏这小子怎么看都是故意不接受联络的! 李彦弘想到这里是越想越烦躁,本来稍微舒展开一些的眉头又紧紧皱起。 “这应该算是好事。”李彦弘在心里安慰了一下自己,“说明这个小子有一些底气,不骄不躁,才会保护自己的信息,不着急和业界联络。” “如果没有点真本事,只是走了好运,大都恨不得赶快卖个好价钱。” 李彦弘稍微坐起身来,伸手按了下面前座机上的一个按钮,不多时,他的秘书便轻轻敲门进来。 “李总,请问什么事情?” “燕京电力大学的付教授那边,后来还有什么消息吗?”李彦弘问道,这是纸面上唯一合理的沟通渠道。 “没有新的消息了,上次他回复说学生不希望被打扰,跟您汇报过一次。”秘书匆匆翻了下自己的记事本,补充道,“他说自己会代为转达,但我估计最多也是随口一提,或者和其他相似的情况一起提一下,可能起不到什么作用。” “围脖那边,我们也已经派人联系过学生本人,但他看起来好像不怎么使用围脖的样子。上次发完澄清文章之后,就再也没有更新过动态了。” “不过,他的围脖注册手机号,我们前两天去协调要来了。”秘书有些犹豫地说道,“考虑到对方似乎不大想联络,我们也没有擅作主张去联系。想着等您这边忙完了,再由您做决定。” 这位秘书跟着李彦弘也有些年头了,知晓分寸。公开的联络途径,她都安排了尝试。 但像这种通过一些方式手段,弄到了别人的私人手机号,由于有一定的风险,她会留给李彦弘自己决策,绝不会逾越。 “手机号码给我。”李彦弘只顿了一两秒,便很快做出了决定。 他很愿意维持礼貌和风度,但他终究还是更希望可以把事情办成。 随着时间的推移,流逝的每一秒都在加大自己争取不到这个人才的风险。 既然已经决定,李彦弘办事从不墨迹。 他接过秘书手中的笔记本,直接掏出手机开始拨号。 “喂,您好。”孟繁岐最近一段时间其实也接过不少各公司人力又或者是猎头的电话了,除了这些人,平时他根本接不到什么电话,“请问是哪家公司的?” 深感信息泄露的危害,如果不是因为对国内这时期的报价还有些好奇心在,他早就把手机给关了。 “孟同学,听起来炙手可热啊。”李彦弘笑道,“自我介绍一下,我是白度的李彦弘,其他的应该不用我再多说了?” “李总?久仰久仰。”孟繁岐对李彦弘会来找自己,其实没有感到那么意外。作为去年唯一和谷歌竞价的国内公司,李彦弘应该是这个时间点唯一一个可以明白自己成果价值的大厂高层。 “不过我确实没有想到,是李总亲自电话来跟我联络。” “不这么做,怎么凸显出我们白度的诚意呢?”李彦弘心说果然,这小子是对自己的价值门儿清,“你现在还在学校附近吗?” “在附近。” “在附近的话,我们直接见面聊,一共也没有几步路。”李彦弘直接站起身来,翻了翻自己的日程表,“今天有空吗?来我们总部,或者我们附近约个地点都可以。” 第40章 第一次,有点不熟练 孟繁岐没有料到李彦弘会如此直截了当地提出会面。 询问了一下,这才恍然,原来李总此时就在北五环外的白度总部大厦里。 孟繁岐倒把这茬儿给忘了,别看这地方偏得很,鸟不拉屎。还真有几个大厂在此安家。 “李总盛情难却,我当然不好推辞,我们约在外面,就不去贵公司内参观了。”孟繁岐已经决意先去硅谷,谷歌发展,这时候自然没有必要去白度内部看什么东西。 在他看来,李彦弘在此时也无法给出好过谷歌的条件以争取到他的加入。 因此,这次见面,孟繁岐是想确认一下合作的可能性。 谈合作,还是要在外面。 孟繁岐原本就是第一次单独应对这个层级的大佬。 气势上就首先逊色了不少,再跑到人大本营去,孟繁岐可没这个胆量。 挂了电话之后,没有耽误太久,孟繁岐便赶往与李彦宏约定的路口等待。 不多时,一辆黑色的奔驰s600缓缓停留在路旁。 后座的李彦弘降下车窗,冲着在一旁等待的孟繁岐招了招手,神情举止之间尽显自信和气派。 孟繁岐缓步上前,回忆了一下,这两年好像正好是李彦弘接连夺取华国首富的时间段。 百亿美金的身价,开两百多万的车,其实已经算是低调了。 “李总,我坐后面吗?” “上来。”李彦弘往里挪了挪,顺手拍了拍自己空出来的座位。 “所以,孟同学,你能跟我说说这个drea吗?”见孟繁岐上车关了门,李彦弘也不多啰嗦,直奔主题道。 “你是怎么想到这个方法的?你觉得它会对这个世界产生什么影响?” “李总,你是不是想问点更具体的东西。”孟繁岐闻言笑道,“怎么一上来就绕弯子?” “哈哈哈哈!你要是愿意说,那自然更好。”李彦弘见他应对不卑不亢,还有心思跟自己开玩笑,也颇为欣赏,“实不相瞒,我已经让团队尽全力在尝试复现你的结果了。尽量从你公开的那篇生成式对抗网络里找一些蛛丝马迹。” “跟你说这个话,我也不怕丢人。我们目前做出来的最好成果,也就只是和去年的alex相若,完全无法想象你的这个结果是如何做到的。” “我现在只是个普通本科生,您肯亲自过来,这在国内算是独一份了。”孟繁岐这段时间不与这些厂商联络,除了确实不打算入职之外,便是用这种最简单粗暴的办法去筛选有诚意的人。 “李总是我的前辈,也是计算机出身。我们之间交流,是技术人员之间的交流,我就直接论文说话了。” 孟繁岐直接从包里掏出了drea的论文,这份稿件已经投递,在12月的会议上也会做详细的报告。 再多藏个一个月,其实没什么意义,还不如直接拿出来给李彦弘这个面子。 对孟繁岐来说区别不大,不过节省至少一个月的开发探索时间对白度的团队来说,那可省了不少钱了。 光是十几个月薪大几万的研究人员,这加起来就是小百万之数目。 “这么爽快?”李彦弘眼神一亮,他是全然没想到这个本科生竟然如此利落,直接将论文稿件掏了出来。 这段时间,别说是专门的研究人员,即便是李彦弘本人,也对到底如何能够做到这个结果十分之好奇。 话不多说,他直接快速地翻阅浏览了起来。“不错,我一直困惑于更深的网络无法取得更好的结果这一问题。按理来说,更深的层数和额外的参数,总是能够使得模型的学习能力更强一点。” “这真是一个简单而优雅的解法啊”李彦弘读到方法部分,不禁发出了这样的感叹,“我原本预期会看到非常复杂的结构和设计,却没想到你的方式如此简单明了。” “如无必要,勿增实体。我相信简单而有效的办法才是最好,最泛用的。” “你有没有想过,ai技术会对人类社会产生怎样的影响?”李彦弘的座驾已经到达白度总部附近的一个不起眼的小会所。 李彦弘常有贵客来访,不愿意去白度总部,或者不方便去不喜欢去的自然也有不少。 这周边他便备有些许不起眼小基地,店面可能是卖点木雕,茶叶的小店。但内有乾坤,楼上有一两个不大不小的房间,可做会面商谈之用。 装修所用的材料和色泽都显得古朴而内敛,店里没什么客人,可能这小店原本就不是为了做生意之用。 这也许就是内地首富的格调和情趣? 李彦弘带头步入店内,孟繁岐紧随其后。 没几步,绕到了小店后面,没想到这里面暗藏玄机,还有个不大不小的花园。 旁侧有一个小型的人造瀑布,水声潺潺,颇为雅致。 “ai对以后产业的影响,可能主要分三个方面。”孟繁岐一边欣赏景色,一边回答着之前李彦弘的问题。 “如果按普通人的视角,可能有些说不大分明。但要按技术从业人员的角度,我觉得无非是三个主要赛道,视觉图像,语言语音还有推荐图谱。” “你准备专注什么方向?”李彦弘本以为孟繁岐是专精某一方面的技术人员,却没想到他技术视野颇为广阔。 “何必非要专注什么方向呢,如果提前划了一个框架把自己束缚在里面,会很容易限制住自己的思维的。”孟繁岐笑了笑,小孩子才做选择题,大人我全都要! 李彦弘不易察觉地微微皱了下眉头,一个领域的内容何其广博,单单图像就又能分出,分类,检测,分割,超分辨率等多个大方向。 眼前这位本科生虽然成果斐然,但若是这个做事的心态,可不大行啊。 不过他倒没有表露出来,而是领着孟繁岐快步来到后庭的房间内,“来,坐。” “我还是第一次直接和李总这样级别的巨头直接对话。”孟繁岐坦然入座,但说实话,还是紧张。“有些生疏,李总不要见怪。” “哪里哪里。”李彦弘全程没有任何居高临下的姿态,完全做到了平等相交的样子,这让孟繁岐其实有些惊讶,“我也是第一次专程联络这么年轻的本科生,可见你的成果有多大的潜力和价值。” “我们直接跳过招聘的部分,来谈谈合作。”孟繁岐微笑道,李彦弘的表情为之一滞。 第41章 未来模型的大与小 “孟同学就完全不考虑加入白度吗?”李彦弘表情波动了一刹那,但几乎微不可查,“我想我应该是现在全华国最重视ai技术的ceo,我们白度也是全华国目前投入最大的公司。” “你已经有了心仪的去处?还是说,你对条件有很高的要求?具体的情况我们可以再谈嘛,直接跳过这个环节,是否太草率了一点。”李彦弘此时求才的心还是很诚的。 “我倒是没有任何怀疑李总诚意或者财力的意思,我听阿里克斯说李总去年出价的力度绝对是冠绝全场的。”这其实是虚张声势了,阿里克斯自然不会对外人说这种细节,不过在李彦弘听来,这么一个细节绝对大大增加了话语的可信度。 “虽然没有提到比较具体的细节,但他说如果不是辛顿老师的背伤,其实他们很希望加入白度。”这个其实是后来辛顿自己访谈中透露的,孟繁岐使用了两个细节,显得自己已经和辛顿团队非常熟悉,争夺到了一定的主动权。 “你已经和谷歌大脑的人联系上了?”李彦弘想起去年竞价的事情,还是一肚子气,这件事真是晦气。 原本白度最早提出的千万美金已经几乎打动辛顿了,教了一辈子书的辛顿哪里见过这么多钱,当即口头表示了意向。 结果在正式签署敲定之前,他那两个学生拦住了自己的导师,出了个注意。三人成立了一家空壳公司,让科技巨头来竞价,以收购的方式雇佣。 这一来一去,时间一耽误,就给了谷歌操作的时间和空间。 最后的竞价上,李彦弘明明没有输,只是对方三人心向谷歌。见谷歌出价已经高过自己的心理价位,就直接敲定了结果。 这么办事情,还竞价什么,直接跟谷歌去谈呗? 虽然表面上白度的表现在那次事件中一直很体面,但李彦弘心里还是有些不爽的。 当初谷歌拿下辛顿团队是近水楼台先得月,如今燕京出了一个不得了的本科生,学校还就在他白度的总部旁边。 李彦弘觉得这是时来运转,天道有轮回。 加拿大离你美国近,燕京离你美国还近吗? 因此李彦弘今天驱车前来会面,心情还是不错的。 却没有想到,还没聊几句,竟然情况和走势又要和去年一样了。 “谷歌大脑确实已经给我发了意向书,条件相当优厚。”孟繁岐坦然相告,“实不相瞒,我基本上已经决意加入,因此先前说跳过招聘的部分,也是为了节约李总的时间。” “孟同学,不管谷歌究竟给你开出什么条件,你都可以拿他们的合同直接来白度就职。”李彦弘回想去年的情况,也不来回竞价了,直接就给了一个封顶的条件。 “不论你能和谷歌谈到什么价位,我都多出百分之20。”李彦弘表情沉重,一字一句道。 去年为了辛顿团队4000多万美金愣是没能拿下,今年这个本科生,谷歌怎么也不可能出更高的价格。 李彦弘虽然嘴上说不论多少,其实还是有一个心理的底线,只要不超过他去年的开价,他都可以接受。 孟繁岐听了心里暗笑,若是真有魄力,就别管别人出价多少,直接报出个价位来才叫自信。 还得拿别的offer过来才能要价,怎么听都感觉有点缺乏定价能力的味道。 值得多少,自己竟然没数吗?还需要看别人的出价。 不过孟繁岐既然不打算加入,便也没有多想这件事。 “李总,钱的事情当然很重要,但也不能说是全部。我和谷歌也没有完全谈完价格,目前他们给我开出的价格大概是千来万美金。” “我还有许多其他在意的因素,比如说学业,您可能也知道我休学了,但一直休着也不是个办法,我总得找个斯坦福这样的大学读读。” “当然了,这些其实都是我个人的事情,算是小事。更重要的事情是,华国目前的情况和氛围,是否真的适合最前沿的ai技术发展。” 孟繁岐虽有重生的优势,但有一位长者说得好。 人呐,就不知道,自己不可以预料。 一个人的命运啊,当然要靠自我奋斗,但是也要考虑到历史的进程。 “华国的氛围是否适合最前沿的ai技术发展?此话怎讲?”李彦弘如今也是走在开拓道路上,这件事情自然是他非常关心的事情。 “李总是这个时候唯一愿意亲自出马来找我的人,我便也掏心掏肺跟您说几句心里话。”孟繁岐回顾了一下ai整体的发展脉络,如此说道,“alex和我的drea现在彻底打开了深度学习的大门,可以预见,在短时期内,各个方向和领域的ai模型性能将会有一个巨大的突破。” “不错,如今正是比拼时速的时候,一步快,则步步快。”李彦弘点头称是,肯定了这个前提。 “技术上的指标是一回事,从总体的趋势上来看,如果想要真的把ai的技术落地,让人们都可以使用,无非就是把模型做大或者做小。” “做大或者做小?你是指终端还是云端两种发展的方向?”李彦弘很快跟上了孟繁岐的思路。 “没错,学术研究的时候起初不会过多关注模型的参数量大小,和它的计算损耗。但实际投入使用的时候,则会必然分出极致优化缩减的小模型,和强调性能开放接口给人使用的云端大模型。” “在早期的时候,可能会反复魔改和调整模型的结构和设计,让模型尽可能快,尽可能好。但久而久之,随着数据的积累,筛选,更高质量的标注,以及最重要的,更大的模型参数量。” “规模极其庞大的模型,会在某一个临界点彻底产生质变,让绝大部分小模型失去价值。尤其是以语言语音类,和图像生成类模型。它们的使用体验是无法向下的。” 孟繁岐回想起重生前,李总面对chatgpt(35版本)和gpt-4,强行顶住压力提早推出的大模型文心一言,不得不在心中叹了口气。 其实文心一言并不是一无是处,只是这种与人交互的智能模型,如果相形见绌,就会显得特别不堪一击。 第42章 给李总一点小小的技术震撼 这种与人高强度交互的ai智能,只要它的能力提升了一点,人们就很难继续回去接受性能更差的版本了。 就如同分辨率一般,大家看惯了高清之后,是没法接受模糊的480p的。 一旦输掉了大模型的军备竞赛,绝大部分用户都会被顶部的巨头虹吸走。 而想要取得chatgpt这样的成功,其实技术层面的占比就不是特别大了。 gpt和gpt2都是论文代码都开源的技术,只不过当时bert类的,将语言任务具体分为几个分支的技术方式更加的火爆。 因而gpt系列这样专注语言生成的技术,则一直被忽视。 gpt3, gpt35,在默默无闻的情况下持续迭代新的技术,这在华国的互联网氛围内是非常困难的事情。 曾经辗转过燕京尚海2-3个大厂的孟繁岐,深知这些互联网大厂的尿性。 只要稍稍看到一些技术的突破和成果,所有的人都在问一个问题,“到底怎么才能把它变成钱?” 过分无意义的内卷和竞争,导致996的大厂们很难去接受一个需要迭代几年以求一鸣惊人的大突破。 而这个方向的技术,又恰恰是高校基本上无法负担得起的。 孟繁岐从来不是崇洋媚外,厉外垃同的人。但他纵观ai的发展史,也不得不承认,围棋的alphago,dna的alphafold,乃至突破性的大模型,chatgpt。 却始终没有一个是华国出品。 难道是华国人不够聪明吗?当然不是。 去翻阅一篇篇顶尖的ai论文,很容易就可以发现很多明显一眼就是华国人的名字。 可越到开创性,突破性的工作,这些华国人的机构就总是国外的院校和研究院。 这才是孟繁岐即便借助重生的优势,也不得不选择去硅谷发展的原因。 想要在国内的大厂,打好坚实的研究基础,所要付出的努力,需要承担的压力都实在太大了。 模型的设计,理念的提出,只在早期可以起到如此显着的效果。 越到后面,其实高质量的数据会起到更加关键的作用。 “所以你基本上完全否定了小模型的价值?”李彦弘对这个观点,不敢苟同。“在我看来,小模型和移动端模型与智能,是有非常广大的市场和前景的。” “这取决于具体的应用场景,终端的智能究竟做什么用途,是否可以稳定联网。如果只是最简单的图像分类和检测,又在无法稳定联网的情况下,当然还是具有一定的价值。” “比如自动驾驶场景。”孟繁岐补充道,“我怎么会否定小模型的价值呢,作为研究算法的程序员,我相当关注具体模型和技术的精确度和运行时间。” 孟繁岐从包中掏出了几张检测算法的实验记录表格,“李总,你可以看看我过去几个月的实验结果。我是在十分了解小模型加速优化的情况下做出的判断,而跟您谈合作,我也不是只靠着一个竞赛的冠军。” ia竞赛才刚刚结束没多久,生成式对抗网络这么爆炸的创意,论文也刚刚发布出来,这小子竟然还有时间和精力去搞其他的研究?图像的检测算法? 不得不承认,李彦弘被震惊了,但很快他就发现自己还震惊早了。 这特么是什么恐怖的结果?在检测准确度有质的飞跃的同时,模型的运行推理速度竟然是现在顶尖算法的一百多倍?? 你不是在跟我开玩笑?这个结果肯定有问题。 李彦弘是精通计算机技术的人,正因为如此,他一时间根本想不出好的办法,甚至好的可能性来解释这个夸张结果的原理又或者是可行性。 语音和图像检测是白度现在主力在搞的技术,他甚至为之组建了华国第一个专攻这方面的研究院。 里面不少才俊都是如今天这样,他亲自去谈去沟通,或者派出非常亲信的下属去招来的。 李彦弘不是要否认孟繁岐的才能,只是这个差距实在太过夸张,让他一时间根本无法解释也无法接受。 “难道要我承认,我这一大家子研究员,上上下下几十号人,还不如面前这个本科生的百分之一?”正值自己人生巅峰的李彦弘心理上实在接受不了。 检测的推理速度差了一百五十多倍就算了,对方竟然还没有牺牲性能来换取检测速度。 这特么到底算是怎么回事? 李彦弘已经看完三遍这个表格了,这表格上都是简明易懂的数字,加上几个使得内容更好理解的可视化图表。 孰优孰若,一目了然。就是让初中生去看,一分钟也看明白了。 但李彦弘已经反反复复看了三分钟了,他一言不发,翻来翻去,不知道在确认些什么。 似乎是想要找到一些不合理的地方,但找着找着就发觉不对劲。 这实验记录上的所有数字,就没有一个是对劲的。 个个都是自己现在阶段想都没有想过的级别。 “不是额你这个额”李彦弘张口想问些什么,但竟一时语塞,这在他的人生当中也算是非常少见的情况了。 “你保证,额你确定这些数据和结果,是没有问题的是。” 这其实是一句废话,孟繁岐笑道,“如果有问题,我怎么敢拿给李总您看呢?” 李彦弘将薄薄的几张纸放回桌上,靠在椅背上闭目养神了半晌,最终反问道,“你想要怎么合作。” 孟繁岐心中暗笑,看来李彦弘也被超前两年的技术突破所震慑到了。换其他行业也许两年没有什么新东西,可在ai的这十年里,尤其是13-18年的前五年。 原地飞升的技术可不在少数。 “李总,出于我个人和其他方面的一些考虑,我今后几年的重心可能不在国内。但不在国内,不加入白度,并不代表我们技术上不可以合作。” 孟繁岐知道,随着李彦弘的这句反问,交流的主动权已经逐渐来到了自己这边。 “我国在互联网和一些技术方面,一直有自己的管理和限制。许多国外公司的技术和服务,是不能够直接顺利地在国内提供的。这点李总应该是感触颇深的。” “而ai技术往后的发展,会非常依赖海量的数据和企业的管控,这两者又是华国不论如何也不会彻底放开给国外企业的。” 说到这里,孟繁岐的意思已经相当清楚了。 第43章 又双叒叕突破啦 孟繁岐的这番话,听起来让人觉得不是那么舒服。 言下之意,给人一种华国ai技术就是不如国外的感觉。 这是李彦弘不大喜欢的,毕竟他这么早就关注ai技术,就是为了研发最前沿最先进的技术。 孟繁岐大概猜到了他的想法,前世他也曾被早期华国大量发表的ai论文所迷惑。 觉得在这个新崛起的技术上,华国已经可以和美国分庭抗礼,不落下风。 虽然alphago震惊了世人,但毕竟有些华而不实。 直到上千亿级别的语言大模型出现,这种纯硬核实力的比拼,让孟繁岐不得不甘拜下风。 实际上,并非是技术手段和算法层面上相差太远。 更多的还是因为优质数据的数量不足。 白度的文心一言,出图的时候甚至会将用户的中文输入翻译成英文,再去作图。 很多较真的网友故意测试了中英文差异很大的词汇,比如总线(b),鼠标(oe)。 文心一言绘出的图像竟然是大巴车和老鼠,这从中文上是完全说不通的事情。 可见即便不是全部,文心一言这个所谓的专注中文的超级大模型,也在相当程度上借助了英文基础的模型权重和技术。 究竟为何要这么做,说到底还是基础不够扎实牢靠。 整理数据,清洗数据,给数据打上高质量的标签。 这些都是脏活累活,见效慢的工作。 把别人公开的数据拿过来跑一跑训一训,多么方便快捷? 以国内996大厂的内卷风气,很难容下长回报周期的基础建设。 早些时候看看不出区别,只觉得国内大厂频繁在xx榜单上露面,刷榜,又是超过这个,又是超过那个。 直到语言大模型阶段,基础语料数量和质量上的劣势才暴露无遗。 “其实这也不能完全怪华国的大厂风气,美国的互联网起步要早,并且很多领域的文献材料归档做得特别好。”孟繁岐也曾仔细思索过这方面的问题。 “像github,arxiv这样的大型公开社区,里面都是非常优质的外文代码或者论文。这些也不只是美国人自己的积累。而是通过公用的形式,收割了全世界的数据。” “华国人在github上贡献的代码行数也不在少数,反过来看看华国的论文社区,就比如知网,纯纯就是毒瘤。里面屯点硕博生的论文,还要论页数收费。就连下载之后的阅读器,甚至都需要专门的” 此消彼长之下,差了多少珍贵的数据啊 只是此时此刻,李彦弘应该还没有想到这么大规模的数据用于训练。因而孟繁岐也不急于一时和他讨论后面语言类的技术,以及生成式的大模型。 最近一两年内,孟繁岐的重心还是在视觉图像算法这边。 “李总,我个人相信ai技术的开源程度是相对的,不可以一直这样透明下去。只是最后成为壁垒的可能并不是模型本身这个纯技术范畴,更多的可能是计算能力,高质量的大规模数据,以及一些精髓的训练与反馈方式等等。” “即便是现在的开源时期,算法产生到模型和代码公之于众,其实正常来说,有个半年到一年的时间差,都是正常的。” “对学术界来说,这不是一个特别长的时间,但对业界能够真实落地的方向来说。这个时间导致的结果可能是天差地别,甚至是一个企业生与死的区别和距离。” 李彦弘闻言微微颔首,他自然明白孟繁岐话里暗示的意思。 假设说,李彦弘他想要推出一个实时高性能的图像检测应用,目前市面上的算法是没有能够支持他所需要的计算速度和准确度的。 即便孟繁岐愿意公开手里的结果,以论文的审阅方式,至少也是半年后,人们才会知道其中的技术细节。 再加上复现和试错的时间,他能够在8-9个月内的时间里把技术应用进去,就已经很快了。 但如果与孟繁岐合作,自然就能够提前8-9个月直接获得这项技术。 这么长的时间,足够李彦弘把各方面的适配,嵌入,甚至是app和用户界面等交互的东西全都开发完备。 市场方面的宣传和交涉也可以早早展开。 等到技术首次公布的时候,竞争者们还在看论文,惊叹于新技术的性能。 白度则已经和潜在客户谈了三四个月了。 竞争者们还在争相复现结果的时候,白度则可能连订单都已经签下了。 一旦白度这样的大型龙头企业能在技术创新上打出半年到大半年的时间差,后起之秀就很难分到大块的蛋糕了。 李彦弘心里计算着这里面的得失,觉得如果对方实在不肯考虑招聘一事的话,的确这种合作对自己来说百利而无一害。 “你的意思是,你总是会第一时间,又或者是提前和白度分享你的最新成果,或者一部分成果。”今年下半年的孟繁岐非常高产,drea,生成式对抗网络,加上刚刚给李彦弘看的新型检测技术。 虽然觉得有些难以置信,但李彦弘已经不怎么怀疑孟繁岐的产出能力了,他唯一有疑问的是具体的合作方式。 “你不接受雇佣,自然就没有工资收入。技术入股,这点东西还不够看。产出没有定数,或者说得难听些,你也不会什么成果都来找我。那你希望以怎样的形式合作呢?”李彦弘询问道,“你计划成立空壳公司,白度按照你提供的技术和具体指标来定价收购?” “你难道就不想早点收获财富吗?”李彦弘其实有些费解,他拿起手中的纸,掂了掂,“就这里的算法和模型,一手交钱,一手交货,多么方便快捷。” “李总说笑了,这又不会是一锤子买卖。”重生者做技术突破,用点力气当然是必要的,但也不必用尽全力。且不说有部分技术受到限制不好直接做出,即便做得出,也总得多留点空间给自己不是。 一个人若是有了突破世界纪录的实力,那自然还是分个十次反复突破来得划算,哪有一步到位的道理。 要得就是,他又双叒叕突破世界纪录啦。 第44章 试作协议 “仅仅只有算法内容被白度采用的情况下,我才会获得收益。其他的时候,不需要李总您出一分钱。” 孟繁岐的宗旨就是,我的东西你看不上可以不用,我一分钱也不收你的。但假如你准备使用我的技术,就不要想着一次性买断把我给打发了。 “李总如果对这个结果感兴趣的话,我们当然可以就这个技术先尝试合作一次。只不过我想要的报酬是按照算法的使用规模,使用人次或者该算法为核心的总收益这种方式按比例抽成,不知道李总能不能接受呢。” 李彦弘不理解孟繁岐的底气到底从何而来,昙花一现的天才其实很多,只有一两个格外杰出的代表作。 而后便泯然众人矣,平平无奇,再无建树。 “他究竟何以有如此强烈的自信?” 李彦弘带着强烈的不解与好奇,点头答应了这个条件。 但犹豫了一下,他还是忍不住问道,“你难道就不怕我们基于你的算法自己做调整改进,然后逐渐稀释你技术的占比,以避免支付大部分应当给你抽成的金额?” “哈哈,我当然是相信李总的智慧,不会做这种杀鸡取卵的事情了。这种抽成的方式,我抽得越多,就代表我提供的价值越大。我想李总高兴还来不及,总不见得因为这点小钱,就和我这个小辈撕破脸?” 孟繁岐嘴上这么说,实际上最大的自信当然来自于他对于算法技术的精准刀法。 专门切在现在的视角上看起来非常强,属于革命性突破,但在孟繁岐看来仍有不少提升空间和余地的位置。 英伟达年年显卡挤牙膏,他孟繁岐这趟回来,也要给你算法一点点挤牙膏。 如果真的翻了脸,孟繁岐也大可以透支一个方向两三年的技术时间,狠狠地给白度上一课。 要是搞出什么恩怨来,专门抓着对方的核心ai算法技术超车+直接开源,也不是真的做不到的事情。 听了孟繁岐的话,李彦弘爽朗地笑着跟他打哈哈,但心底里却还是进行了一番思忖,当真考虑过这件事的可行性。 不过这个决策倒不急于一时,完全可以之后再审时度势。 此行虽然没有如计划般顺利把人招进来,但这个图像检测算法的巨大突破,李彦弘还是相当欣喜的。 作为白度的当家人,他平日里相当忙碌,今日难得有空当面会谈,李彦弘自然不希望空手而归。 两人随即便对算法带来的收益如何计算进行了详细的讨论和博弈。 孟繁岐首先主张了几点: 一,是减少运行成本带来的收益。即便是不考虑检测算法准确度的情况下,单单是运行速度提升的这一百多倍,就能够极大地节约白度的时间成本和算法的运行损耗。 稍微了解过挖矿的朋友都清楚,大规模的运行特定的算法,光是对电力的消耗就不是一个小数字。更不要提相关的设备和场地支出了。 在首次应用该系列算法的第一年,孟繁岐要抽成被节约部分的百分之20,次年为百分之10。 再往后则视算法的更换情况重新商议。 二,则是强性能提升带来的热度和用户增长。强力的性能突破是能够吸引大众的,现在网友对这种新事物的关注度很高。 越是鹤立鸡群的突破,越是技压群雄的突破,这种类似广告宣传的效果就越明显。 因为宣传方可以采用更加激进的宣传策略,踩在竞争对手的脸上嘲讽,对方也无可奈何。 这种强势非常吸引吃瓜群众。 这方面的收益则由相关媒体报道情况的数量,关注度,浏览量评论量等指标计算。 当然了,最具有含金量指标的则是白度这边推出的相关技术和应用的使用人数以及使用人次。 三,是技术层面的先发优势和研发时间,资金投入的节省。孟繁岐提供算法之后,这方面的研究时间和投入至少能节约一年多。 更别提孟繁岐会提供源码和技术细节,而不是仅仅只提供一个包装好的接口或者功能。 这部分的价值是最难以量化和评估的。 白度完全可以基于这些东西在后面的技术研究上占尽先机。 在这个问题上,孟繁岐展现得非常大度。 不仅没有对具体的数额,比例和计算方式斤斤计较,反而是将球完全踢回给了李彦弘。 李彦弘在谈判来回拉扯之余,也是心如明镜。 眼前这小子是在以退为进呢,这一项自己愿不愿意出血,完全就是一个类似投名状之类的东西。 虽然接触还没有多久,但以李彦弘多年的职场经验,不说阅人无数,见得也不少了。 他有很强烈的感觉,这些东西还远远不是眼前这个年轻人的底牌和极限。 如此一来,反而让他有些被动,有关第三点的东西,给少了,怕错失什么。 给多了,又感觉自己这一次被一个小了二十多岁的年轻人完全拿捏。 进退两难,李彦弘紧紧抿着嘴唇,感觉心理五味杂陈。 良久,两人总算大约谈妥了几个主要方面的事宜和比例。 这次会谈并没有其他人在场,因此谈好的内容也只是一个初步的口头协议。 “稍迟几天,我会让人把草拟好的正式合作协议发到你的邮箱。”李彦弘率先起身,虽然今天做得完全不是他想做的事情,不过单就技术上来说,还是取得了他意料之外的大收获。 “其中一些指标和分成上,到时候合同里可能不会定的那么死,毕竟这方面的计量方式经常也会变化。加上还有一些不好评估的东西,希望你谅解。” “还是那句话,我信任李总的目光和格局。”孟繁岐笑着答道,这时节李彦弘应该是国内厂家里最舍得在这方面砸钱的了。 这件事他倒没有太担忧,这种合作关系就像男女关系一样,死死限制是约束不住的。只有靠不断提升自己的吸引力,能力,让自己很难被取代,才是真正地掌握了话语权。 以后合作得不愉快了,他想换其他大厂实在容易得很。 “技术才是核心生产力啊。”孟繁岐心中暗暗感叹道。 第45章 改变,从你我开始 与李彦弘一同走出那间私人会所,孟繁岐的心情相当不错。 李彦弘对ai前沿技术相当看好且执着,在这方面的许多条件上都很好说话。 孟繁岐与他接触下来,感受还是相当不错的。 如果这次尝试性合作,白度总体做得很好的话,孟繁岐也懒得在国内继续寻觅其他的合作伙伴。 毕竟这个时间点,ai技术的热度还远不够高。 “那我们一两周后再约个时间见面。”李彦弘同孟繁岐握了握手,“到时候你把算法和模型准备好,我们把合同等相关条例准备好。事情敲定之后,我希望会出一个实时的智能检测app,来看一下这个技术的市场反响如何。” 对于图片上内容的检测,有一个极大的质变关键点就是实时或者即时。 并不是所有需要检测的图像都是提前做好准备和预处理的。 许多场景的输入,会是摄像头的实时拍摄,在这种情况下,算法的速度是非常大的瓶颈。 游戏玩家应该会非常熟悉一个fps的概念,说得直白一点,就是每秒的帧数,每秒展示了多少张图片。 这个数字越大,自然就越流畅丝滑。但同时的,算法需要处理的图片数量也会成倍增长。 目前时期高精确度的传统算法,一两秒钟算一张图片,已经很快了。 而一般来说,fps至少要达到十几二十,才能够真的算得上是流畅的实时检测。 若是可以达到60-70fps,则可以明显有那种极其流畅,完全实时处理的感觉。 “现在这个时期,对于检测算法速度慢的问题,通常都是采样的办法。”孟繁岐回忆道。 采样的原理很简单,我一秒钟只能处理一张图片,那我就不管其他帧,只每秒抽取一帧来检测。 但这样的做法,就会导致框追人,等检测框被预测出来的时候,框里面的物体早就跑到框外面去了,给人的使用体验非常差劲。 如果视频内容中的物体大多数都在快速移动,那就是空框满天飞,纯纯的视觉污染。 “没有问题,我也会信守承诺,在至少6个月后才会投稿论文或者公布技术细节。”这也是刚刚谈到的条件中重要的一环,白度不独家占有该技术。 但孟繁岐必须等到14年6月后,才允许投稿或者公开该技术。这个时间孟繁岐是完全可以接受的。 “等你真的去了加州,” 孟繁岐与李总握手告别后,谢绝了李彦弘拍司机送他的好意,独自离开了白度的园区。 李彦弘则待在原地,看着手里薄薄的几张纸,若有所思。 回到总部之后,李彦弘躺在自己的老板椅上,继续思索了良久。 旋即,他做出了两个重要的决断。 一,白度要在海外的硅谷开设ai研究室。 孟繁岐拒绝自己的理由,让他一定程度上醒悟了过来,整体的学科氛围和环境也是很重要的。 去年白度在与谷歌的天价拍卖中落败,加拿大距离美国近太多,是一个很重要的因素。 如果自己有一个出色的硅谷ai研究室,那么去年争取hton团队,刚刚争取孟繁岐入职,都会有出色很多的竞争力。 在这一点上,自己的反应慢了。李彦弘如此反思道。 第二点,白度需要聘请真正具有国际视野,最好是还有和巨头企业合作经验的业内大佬。 需要一个这样出色的人物来给白度把关。 李彦弘目前最中意的角色是吴恩达,他是华裔,斯坦福ai实验室主任,又是谷歌大脑的创始人之一。 如果自己的动作不快一些,那么白度落后的只会越来越多。 第三点,则是在先前谈话中,孟繁岐对他推荐的。 ai深度学习平台,要做到易用,开源。 这个平台其实白度已经在秘密研发当中,孟繁岐的建议让他感到十分惊喜。这说明眼前这位技术人才同样具备自己这样的领导者或者说企业家视野。 搭建好这样的开源社区,就能够吸引到源源不断的ai算法人才,基于这些工具去做研究。 这个方向目前还是一片荒漠,等待探索。 孟繁岐的这个建议,让李彦弘感觉如拨云见日。 即便不能够招募到足够的人才,只要维护好这个平台,白度永远不会缺少相关的便利。 要将普通人接触ai算法的门槛,降低降低再降低。 要让每个人都可以通过尽可能少的操作,接触,训练,修改,使用这些模型和技术。 必须要让白度ai平台从一个少数科学家、大企业才用得起的产品,变成整个社会的基础设施。 这的确是李彦弘在这个阶段还没有开始考虑的事情,如梦初醒的李彦弘对孟繁岐的评价再提升了几分。 就在李彦弘联系余凯等得力下属商讨各方面细节的同时,孟繁岐则一如既往地回到学校的图书馆里对即将要交给白度的代码进行最后的调整和测试。 他还是更加喜欢图书馆的感觉,在家里或者自己的租处太安逸了,有无数种诱惑可能会中断自己的工作和思绪。 一旦学习和工作的节奏被打断,效率很可能是天差地别。 “我就刷一下手机。”心里这么想着,啪,一下午就过去了。 埋头修改代码的孟繁岐完全没有想到李彦弘如此雷厉风行,今天的这次会面直接提前了白度许多决策5-7个月。 其实说到底还是打工仔低估了科技大厂在这方面投入的决心。 白度去年的净利润首次突破100亿人民币,但李彦宏本人却有一种强烈的危机感。 一方面白度的核心业务依然在贡献着稳定增长的利润;但另一方面,移动互联网正在快速渗透,商业世界的巨大变革呼之欲出,这让白度陷入了某种迷茫。 孟繁岐超前两年半的ai算法性能,就如一针强心剂,让原本就锁定了ai赛道的李彦弘如同打了鸡血一般。 时隔一年,李彦弘重新又翻出了去年此时,他发送给全体白度员工的内部信,《改变,从你我开始》。 “当业务还在快速成长时,不应该快速追求净利润,而是要把更多的钱投入到更多的新业务和创新上。” 第46章 怎么写半篇论文这么慢 孟繁岐与李彦弘所约定的期限,两周左右其实不算短。 只是若想要把交接的这部分代码精益求精,却总是显得有些不够。 孟繁岐对这个时期的平台和工具熟悉程度还是稍有欠缺,虽然视野和大局上超过时代好几年,但落实到具体的实现上,还是有许多小问题的。 原本这些代码只是为了快速得到实验结果,美观,可读性和性能优化上未免就有所欠缺。 再说了,在孟繁岐原本的计划中,也没有想过这么早就会直接和白度这样的大企业交流技术和代码。 终究还是低估了李彦弘在这方面的关注程度,在这个ai还不算火的时候,李总竟然一个电话就亲自前来面谈。 好在这时候自己的身份比较讨巧,对于一个在读的非计算机专业的大学生,人们通常也不会用资深工程师的代码规范去要求。 他连续发布了几个突破性的算法思路已经很惊世骇俗了,要是一手代码再跟十年老码农似的,恐怕都会有想象力丰富的人猜到他是不是重生人士了。 忙了差不多十天的时间,总算又把代码整体优化了一轮。 再次闲下来的孟繁岐,将魔爪伸向了韩辞。 这家伙自从上次被自己绕进去之后,就一直没了动静。 说是要就自己drea的残差算法理念做文章,结果不知怎么的,加了微信也不问自己任何问题,仿佛人间消失了一般。 “在吗?在吗?理论证明写好了吗?论文开始写了吗?ppt做了吗?” 一连发灵魂的拷问直接一股脑发了出去,正在因为紧凑的时间限制拼命掉头发写论文的韩辞看完之后,恶狠狠地把手机摔在了床上。 这是最气人的情况,不是被人狠狠地折磨,而是自己心甘情愿地选了一条受折磨的道路。 姜太公钓鱼,她韩辞愿者上钩,都没地说理去。 眼下时间越发接近月末,距离真的上台,在世界顶级大学和机构们面前展示自己的理论,已经只剩不到两周了。 这对韩辞来说,是前所未有的挑战。而她的论文才只写了三分之一。 韩辞突然感觉越接触孟繁岐这个人,自己的生活中就有越多的不确定性和不可控性。 让自己的生活节奏总被打乱,打得自己措手不及,偏偏结果还是她想要的。 “啊啊啊啊啊!!!” 韩辞大叫着将自己本就已经蓬乱如鸟窝的头发彻底挠乱。 情绪这才得以平复了一些。 “你站着说话不腰疼,有本事你写呀!”韩辞一头倒在床上,气呼呼地回消息,后面还跟了三个头上冒火的表情包。 刚回完这句话,韩辞马上就后悔了。你行你上啊可能对大多数人大多数情况来说都是万用的招式。一击必杀,让对方只能暂避锋芒。 可偏偏这个家伙完全不一样,天赋异禀,写论文做实验就跟特么喝汤一样。 上回见面交流,说得累了他直接从包里掏出一沓论文稿件,一百来页。 竟然都是13年内这段时间的研究成果。 韩辞当时都看呆了,不少研究生一两个月才精读一篇论文。其他多数文章都只是泛泛阅览,了解概要和结论,不会读得特别细致。 翻阅十几二十篇论文,大约会有一篇值得非常仔细地去研究。 因而半年下来,普通的硕博生能有十篇左右的文章,整篇都将它逐字逐句研究,烂熟于心,甚至自己去复现,已经算是比较勤奋的了。 他倒好,直接自己写了一堆,关键是还完全脱水,篇篇都是干货,连她这个外行人都能看出厉害之处。 “我就是写好了才来问你的。”孟繁岐浑然不觉,理所应当地回道,这小姑娘咋回事啊,“我对自己的要求,永远比对别人更严格!” “半篇论文怎么写这么久,不应该呀。”孟繁岐继续输出道。“实在不行先做ppt忽悠人算了。” 十二月在会上展示并不需要整篇的论文,韩辞的任务其实只能算半篇论文的量。 只要把主要的内在联系和公式推导准备好,把核心理论部分写好,展望一下可能的研究方向即可。 最终毕竟是以ppt的形式展现,以展示和交流为主,大会并不会收录文章。具体的成品文章,可以交流后再做补充调整,然后投稿。 “烦死了烦死了烦死了!”韩辞也不打字了,干脆拿起手机,打开语音就是一顿输出。 全是情绪,抛弃逻辑。 ?????? 什么情况,这么暴躁?孟繁岐一脸莫名地盯着手机,没想明白发生了什么。 再有十天出头就要出发,大家各自签证都办好了,自己问问对方的准备情况,怎么这么大的反应? 哦,是了。孟繁岐觉得自己悟了,都说每个月总有那么几天。 想必是生理原因,使得这么个文静的小姑娘如此暴躁,口吐芬芳。 那就可以理解了。 “早点休息,多喝热水。”想到这里,孟繁岐决定不计较对方恶劣的态度,而是以德报怨。 八个字,暖她一整天! 而手机对面的韩辞,则对着空气打起了拳击。只是情绪发泄归发泄,却还是解决不了问题。 她想要用数理的概念去对深度学习算法的突破做解释,就势必需要熟悉并且能够解释甚至推测一些常见的实验现象。 想要分析,熟悉,归纳这些现象,自然需要相当数量的实验结果才能推论。韩辞却无处去寻这些实验结果。 通常来说,只需要分析几篇重要论文的实验部分即可,只可惜目前残差网络还未公布,它的实验结果,当然是只有孟繁岐一个人独家掌握,别无分号。 韩辞前面的摘要和相关文献部分已经准备好,公式推论也是她所擅长的,只唯独对实验现象的了解缺少了一大块。 而恰恰ai领域又是极其注重实验结果的部分,如果只单独对残差这一公式进行展示,未免显得内容太过单薄了一些。 “可恶。”韩辞很不喜欢这种失去主动权的感觉。韩辞因此躲了好几天,可到最后还是要去找他,想把文章做好终究还是没有别的办法。 第47章 基础智商计量单位 临近十二月,燕京已经相当寒冷了。 虽然北方的供暖做得很好,但终究只是在室内。 室外的寒风凌冽,比之两周前更甚。风刮在脸上如锐利的刀锋一般,给人一种皮肤被无情撕裂的感觉。 更令人头疼的是燕京冬天的干燥,不论怎么饮水,仿佛都无法缓解唇部的干裂。 下午时分,燕京电力大学南门。 路边已经干枯的树木旁,光秃秃的枝丫之下,身着一件黑色长款修身风衣的韩辞显得格外显眼。 其实韩辞此时的穿着仍旧是以简单为主,不论是款式还是颜色。 她的修身风衣纯黑,没有用前面的两排扣,而是直接用腰间的腰带打了个结,将衣服的前面合了起来。 衣服的上部露出了内部一块倒三角形状,可以看出是一件米色针织衫,从领口看,里面还有一件白色的衬衫。针织衫上面点缀了一枚银白色的项链,不仔细看不是那么容易注意到。 下着看不出是什么类型的裤子,看着还挺宽松的。而本身身高已经接近一米七的韩辞,从没有买过高跟鞋,此刻正穿着一双常见的白色空军一号。 “以前倒没注意过她的打扮。”孟繁岐猛地见到这一幕,有些意料不到。 之前见面的两三次,韩辞基本上都是极淡妆或者素颜,穿着打扮都非常朴素。虽然凭硬实力,已经相当引人侧目,但今天这件风衣实在是质变。 非常贴合韩辞的风格,冷白皮,没什么表情的相貌,加上高挑的身材,非常适合这样的长宽修身风衣。 像麦芒那样不知道有没有160,长相和眼神一看就不大聪明的样子。想必也是无法驾驭这种类型的衣服。 “还是女生显高啊”孟繁岐在心中感叹,韩辞这差不多168-170的身高,看着显得身形异常修长。 这要是换个一米七的男生,这衣服完全就穿不了了。 孟繁岐的身高不高不矮,在175-176左右,一会走在韩辞旁边,给人的视觉效果估计是基本相若。 这么想着的时候,韩辞已经看到了孟繁岐。但她也没什么反应,只是静静地站在原地等待孟繁岐自己走过去。 “你可算是来了,我都不知道你以前的日子是怎么过的。”孟繁岐这段时间可以说是被麦芒折磨得不轻。 “麦芒岂止是猪头,简直就是头猪。但我见她那样热情好学,我不教她也不好。”自从麦芒得知孟繁岐凭借技术一下子就获得了巨额签字费之后,对金钱的欲望就战胜了她的懒惰。 痛定思痛,一反常态,整日里早出晚归,恶补相关知识和技术。 只可惜麦芒学知识就像是狗熊掰玉米,看一个忘一个。 甚至都不需要多久的时间,三分钟前说过的东西,她忘了倒也罢了,能忘得让人甚至怀疑自己到底有没有说过,倒也可以说是人才中的人才了。 这个教学过程就像是询问“马冬梅”一样,“额马冬什么?马什么梅来着?什么冬梅?” 得,您自己玩去。 “她自己的专业课都不学了?”韩辞有些惊讶,怪不得这段时间麦芒都没什么动静,她还以为只是这妮子又在拖延,“马上这学期都要期末了。” “她说月中从澳大利亚回来再学不迟。”孟繁岐笑了笑,捏着嗓子模仿了一下麦芒,“现在学,学了忘,学了还得忘,忘了还得学。” 孟繁岐鹦鹉学舌的只是一小部分,麦芒原本的那一串顺口溜可比这长多了。 一到这时候,这家伙就一点也不显得笨了,口齿伶俐,思维敏捷,歪理也是一套一套的。 “你这件衣服可不便宜啊。”孟繁岐走近了才看分明,这件风衣似乎是万恶的大英帝国的一家知名品牌。 国内专卖店买的话,一件就要两三万。 孟繁岐其实如今手头也有卖出btc的小几十万闲钱了,除开寄给父母的第一笔,余下的都在他自己手中。 谷歌与白度也与他分别签订了协议,想来很快他就能开始有大笔的进账。 但饶是如此,孟繁岐仍旧不舍得小几万地去购置一件衣服。 别说两三万了,就是五六千他也嫌多了。 “可能这就是穷人的命。”他有些感慨,前世他跟随大领导也出过几次差,有幸沾光,品尝到了一些珍贵的食材。 什么顶级和牛,生猛海鲜,个个价值不菲。可惜孟繁岐吃的时候就如猪八戒吞人参果,完全没吃出什么优劣。 甚至于还被和牛的油脂腻到,完全吃不下几块。 “我看你之前的穿着那么朴素,还以为你和我一样都是工薪阶层的孩子。”孟繁岐啧啧道,“却不曾想,我们之间已经隔了一层可悲的屏障了。” “我之前穿的衣服也差不多是这个级别价位,只是你不认识罢了。” 孟繁岐闻言一愣,心说坏了,原来不是今天例外,搞了半天是自己有眼不识泰山。 “??富婆是,上次还让我请客?今天你请。”孟繁岐感觉自己很亏。 “上次我说了,你自己非要请客,怪谁。”韩辞翻了一个大大的白眼,“说得像你现在还差钱似的。” “住口!勤俭节约是我们民族的传统美德!”孟繁岐自知理亏,连忙宣布自己胜利,然后岔开了话题。 “你找我的原因我大概知道,我这段时间实验做得不算多,基本上质量都比较高。”参数的设置孟繁岐都烂熟于心了,自然没跑过几次烂的实验。 “虽然实验数据的数量可能不大够,但那几种现象主要是怎么产生的,原理我也都清楚。最近一段时间稍微准备了下,结果都统计在这里了。” “我给你分了几种情况和类型,稍微总结了一下,你可以参考参考。”孟繁岐从包里掏出几张纸和一个u盘。 “原始数据也都在这里了,如果有需要的话,这两天你再自己仔细看看。” “这么好心?”韩辞大概翻了下孟繁岐给出的数据表格,发现自己主要想要的几个场景都已经被准备地十分妥当了。 “有时候我就想不明白了,以你的聪明才智,怎么沦落到跟麦芒读一个大学。”韩辞微微叹了口气,感叹道。 第48章 你怎么不加我名 “把麦芒当成智商计量单位了是。”孟繁岐虽然自己私下也偷偷将麦作为基本智商单位,但听到她的好闺蜜这么说,还是有点没有想到。 “我也不能算是好心,你从我这里要了数据的话,这篇文章就非得加我的名字不可了。”孟繁岐其实倒无所谓加不加,但如今的关系还没有那么亲密,这种事情还是显得公允一些好。 “随便挂个几作就行,就当是回报了。” 韩辞自然很清楚,这是给自己台阶下。一般来说,论文的作者只有第一作者和通讯作者比较有含金量,其他的位次通常只是象征意义。 如果文章不是特别顶级的期刊,有巨大影响的话,二作三作基本上都是不算什么的。 只是挂个二三作的名字,就把这一系列的事情结算清了,韩辞还是占了大便宜的。 “并且,单就这篇文章的性质而说,其实挂他的名字搞不好还是我承了他的情”韩辞又一次开始陷入不想亏欠别人的焦虑中。 “你现在写了多少了?拿给我看下,我们定一下你的ppt大概怎么做。” 孟繁岐前几天已经收到了主办方的邮件,由于这次的突破相当夸张,因此主办方还是很给面子,允许他做长达45-60分钟的展示。 当然,最好可以把整个的市场控制在30-40分钟。 孟繁岐已经早早做好了自己的幻灯片,这些东西最初是实验和论文写作的时候整理的一些素材,后来经过一定的整理,基本上就可以用作展示了。 “你先看一下我的,我讲述这个故事的视角,主要还是从一个悬念出发。” 这同时也是残差网络的写作方式,孟繁岐在论文最开始的摘要中便是这么写的。 说起来,这个摘要还是导致韩辞和付院长提到孟繁岐的主要原因。 因而韩辞倒也有印象。 “你的意思是,我切入的主题最好也是这里。更深更复杂的网络,理应具备更强的表达能力,但在实践过程中,却无法观察到这个结果。” “没错,我在前面的展示中,会先从做法,网络设计,实验结果这些实践方面介绍和展示这么做的效果。在这部分内容展示结束后,由你来说一说你的理论解释,所以我们的视角还是需要保持一致。” “那我可以先从多次嵌套的普通网络与残差网络之间的公式先入手,然后再引入一个动力系统的一般定义。”韩辞很快进入了专注的学习状态,把那种面对不熟悉事情的不安和焦虑的感觉抛在了脑后。 韩辞专注地盯着孟繁岐的电脑屏幕,看着已经准备好的这部分,眼睛忽闪忽闪。 孟繁岐不知怎么的,不经意地注意到,她的睫毛微微地弯着,特别的长。 “想什么呢?”韩辞稍稍思忖了一下,正在想着自己到底怎么在这个ppt后面继续接上自己的内容。 结果发现身边这个人不知怎么走了神,顿时血压有点上升。心想,跟我讨论问题竟然能走神,这简直就是对我智商的侮辱! “啊没没什么。”孟繁岐的脸皮虽厚,但也不好意思直说原因。 “给我好好看!”韩辞指着电脑屏幕恶狠狠地说道,“我大概做个六七页就够了,也不占用太多的时间,毕竟这个想法还没有特别成熟,先说比较保险的这部分内容好了。” “好看,好看。”孟繁岐笑道,“没事,你想说多少就说多少好了,我这些内容30分钟最多了,主办方给了我们最长一小时的上线呢。” “得了,他们都是冲着你来的,我可不讨这个嫌。我的主要目的只是分享一下这个思路和视角,后面论文准备妥当了,还是要投数学刊物的。” “记得给我加名。”孟繁岐冲着她微微颔首。 “你怎么不给我加!”韩辞感觉自从和孟繁岐接触之后,自己几天翻的白眼比之前一年都多。什么加不加名,说得跟买房加名似的。 “你想加可以加啊,我这么多文章都没合作者的,付院长就只能挂两三篇。”孟繁岐倒是无所谓。 严格意义上,任何对文章没有实质贡献的人是不得作为作者的。 但有关署名的许多规矩,实际上也变得形同虚设了。 尤其是国内各种类似于苦力角色的硕博生很多,别说要给完全不管事的导师加名了,甚至很多时候被抢一作,乃至被踢出作者栏位都是有可能的事情。 要么华国怎么有个特别的规矩呢,叫做导师一作的情况下,学生二作可以算作是一作。 其实说白了就是默认导师很可能会抢你的第一作者身份。 孟繁岐个人觉得,第一作者和通讯作者是需要认真担责,不可随意对待的。 至于二三四作,则可以由一作和通讯商讨把关一下,很多并非严格意义上的学术贡献,其实也可以算作是贡献的。 比如说,国外就有人一直给自己的宠物猫挂第二作者,还发了不少篇文章呢。 原因是宠物猫的陪伴让他感到愉悦和开心,因而帮助到了他的学术研究和论文写作,所以算它是第二作者。 不过韩辞在这方面还是比较较真,虽然嘴上说着,你怎么不给我加名。可孟繁岐真的干脆答应之后,她还是谢绝了这样的行为。 “我希望下次你提出加名的时候,是因为我真的对你的学术研究有重大贡献。”韩辞志存高远,一路被认为天才的她,自然在这方面有点包袱,颇为自信地说道。 孟繁岐嘴上答应得好好的,心里却想,这怕是难了,我这学术成果都预支到十年后了。 两人正一起补全最后几页ppt的时候,孟繁岐手机突然响了起来。 一看来电人的姓名,孟繁岐稍稍端正了一下态度。 “李总?怎么,有事情吗?我记得距离咱们约定的时间还有两三天?” 按原本的计划,应该是三天后约见面,交付算法代码和模型。 李彦弘怎么突然提前打来电话? “孟同学,你今天方便吗?方便的话,我想邀请你提前来白度总部一趟。” 第49章 老板你别是被骗了吧 “提前去白度总部一次?”孟繁岐稍微愣了一下,“主要是有什么事情呢,我这两天有空的,都方便过去,而且其实东西也准备的差不多了。” “已经准备得差不多了吗?那实在太好了,那请你来的时候把东西也带上。我们这边主要是相关的技术负责人想见你一次。” “有这些内容的话,我们可以在实际的框架和服务器内先测试一下,这样对具体的实际使用性能更有数一点,后续我们这边的工作也好继续进行。” 李彦弘的说法中听不出什么问题,但实际上,白度的ai研究院内部,有一些不一致的声音。 “没问题,我这边现在稍微有一些事情,一会确定好时间之后,我再李总联络一下确认具体时间。”孟繁岐没有想多,在他看来,大概是因为app相关的开发事宜。 白度那边需要在他们的环境和设备上确认自己的算法速度,这样才好进行很多具体的计划。 检测速度能做到多少,占用的资源多不多,假设在ios或者安卓的设备上要运行,速度会有什么变化。 这些事情的工作量还是不小的,孟繁岐认为是李彦弘给到他团队的压力太大,因而那边的技术负责人才会想到要尽快和自己结束。 他完全没有想到,白度的技术负责人对自己的结果真实性持有怀疑态度。 李彦弘是白度ai相关研究院的创始人,也是院长。虽然他本身是计算机硕士出生,但毕竟已经回国创业十几年了,不可能一直高度关注技术细节。 李彦弘接触ai和深度学习相关的内容,其实是从白度近两年的一位海归高管,余恺的口中了解到的。 余恺在南大读本科的时候,就已经对神经网络非常关注,那时候还不到2000年。此后的十几年,他一直坚持深耕该领域。 2012年初加入白度之后,虽然李彦弘名义上担任白度深度学习研究院院长,但实际上的掌舵人,技术的主要负责人,其实是余恺这位常务副院长。 余恺在业内的资历很深,2012年开始在白度主要负责推动深度学习技术的应用。 白度在这两年在语音识别,图像识别和广告推荐方面的许多技术突破都是由余恺领衔带队做出的。 而原本时间线上,14年震惊世界的吴恩达加入白度,很大程度上也是因为余恺这个吴恩达多年好友的相劝。 去年与谷歌争夺人才,李彦弘派出的便是这位得力干将。 在他的影响力辐射下,有相当多的顶尖技术人才在这一时期加盟了白度。 以他的研究经历来说,孟繁岐给出的实验方向正好是他最为擅长的专业部分。 余恺09年就在国际视觉识别比赛中夺冠,包括孟繁岐本次夺冠的ia,余恺也曾率队在2010年的首届比赛上夺冠。 只不过那个时候神经网络还没有得到重视。 在余恺看来,李彦弘前段时间带回来的结果是相当不真实的。 “什么斯坦福,it,哈佛,哪个顶尖大学我没去研讨过?现在国际顶尖的检测算法水平到了什么程度,还能有人比我更了解吗?” 余恺质疑的逻辑也不无道理,不过语气上确实冲了一些。 一方面是因为这是自己的专业领域,难免有点不服输。另一方面,李彦弘对这个夸张结果的无条件信任,也让余恺心中有些不快。 假如该结果真实有效,一旦直接投入使用,就意味着自己过去一两年内的许多相关工作付之一炬,沦为无用功。 本能排斥也是人之常情。 “我说老板,你别不是被忽悠了?他就单枪匹马,一个人就搞出了比我们研究院的最新成果精准又快百来倍的技术?” 如果这个技术是真的,余恺有点希望它是假的。但若真是假的,余恺其实又很希望它是真的。 多么矛盾的心理。 “老余,你的视角和想法显得实在狭隘了一些,虽然当天我们没有交流具体的技术细节。但从他今年的两个巨大突破来看,这件事情的真实性是没有疑问的。” 李彦弘此时也觉得,自己可能处理这件事情的方式方法有些欠妥。直接越过了专门的技术人员,这让他们可能会有些情绪 但当时确实也是比较突然,起初只是为了招揽人才,并没有技术合作的计划。 “我就是仔细阅读过他的论文,才更觉得这件事情说不通。”余恺当然不否认孟繁岐drea和生成式对抗网络的成绩。 这两个成果目前已经有所定论了,业内普遍的反响和评价都非常之高。 余恺推测,李彦弘拿回来的这个结果当中,便是采用了drea技术的神经网络作为骨干,因此才会在检测的性能,准确度上有了这么大的突破。 李彦弘带回来的drea论文,他也有仔细阅读。 “drea将神经网络做得非常深,他采用了非常简洁优雅的结构,处理掉了深层网络优化难的问题。” 余恺对这个成果是非常惊叹和赞赏的。 “但与此同时,你的网络也会加深好几倍乃至于十几倍。在这种情况下,网络的参数和运算量当然会随之成倍增长。 当然了,可以做一些处理和结构上的调整来平衡这个问题,但说到底,检测的速度不变慢就很不错了,怎么可能还能加速百来倍呢?” 这其实也是普通人的思维误区了,觉得一个人如果刚刚做出了一些非常重要的突破成果,那他是很难同时完成其他方面的巨大突破的。 在余恺看来,孟繁岐在半年的时间内直接开拓了两个大的领域,无监督式的生成,和真正意义上的“深度”学习时代。 他是不会有时间和精力同时对检测算法有非常深入的研究的。 加上李彦弘这次带回来的是drea的一版本手稿,这也误导了余恺的思路。 让他误以为孟繁岐的检测算法技术突破,主要是来自于对drea的应用。 所以他认为自己很快就理解了性能突飞猛进的原因,可他读完drea论文之后,对这个结构的参数量稍加计算,却怎么也无法理解速度提升到底是哪儿来的。 “要么这样,我把他约过来,我们先做一个技术的交流。这样其他相关的地方也好适配。” 李彦弘突然联络孟繁岐,一方面是为了打消下属的疑虑,另一方面,他自己被说得其实也有点不确定了。 第50章 You Only Look Once: YOLO 李彦弘回想了一下,在当时交流面谈的过程中,自己其实是主动权基本丧失的。 因为起初他的核心计划其实是招募人才和打探drea的技术细节。 而孟繁岐一上车,就很痛快地把drea论文给了自己一版。 这件事情直接打乱了他的节奏,之后的每一步,又都在加剧这个过程。 搬出和阿里克斯以及辛顿的交流细节婉拒招聘,聊到ai模型的路线问题,引诱自己提出技术合作。 然后突然猛地就掏出一个如此惊世骇俗的算法,仿佛此行本来根本没打算提一样。 “仔细回想一下,怎么感觉有点像是魔术的手法。先转移你的注意力,隐藏自己的真实意图。然后再趁其不备,出击骗到你。” 在余恺为首的几位技术人员强烈的质疑声之下,李彦弘不由得不产生这样的想法。 毕竟当时孟繁岐给出的只有一些实验结果,没有任何其他的情报。 如果情况真的如余恺所说,性能的提升来自于drea技术的下游应用,而检测速度实际上未能提升的话,其实也算是很大的突破了。 只能没有到值得他这个公司ceo直接介入的地步罢了。 不过“仿佛此行本来根本没打算提一样”这种感觉确实算不上冤枉孟繁岐,他原本的确打算用这个算法直接和谷歌交涉。 但在李彦弘提出技术合作之后,孟繁岐略一思索,还是认为和白度先合作一次对自己来说非常有利。 首先,白度远比谷歌缺ai技术,更有危机感。李彦弘也是亲自出马来和自己谈,相同的技术,在白度能要到的价格更高。 其次,距离谷歌给自己意向书,才小几个月的时间,自己就能够和白度有这样的创举和技术合作的话。能够极大地提升自己的议价权和谈判空间。 要知道,大点的公司内部也是派系林立,资源这种东西都是要靠抢的。 自己没点历史成绩,没点外部的关系,人生地不熟的到了硅谷,真要是计算资源上紧缺,那多耽误事。 当然了,最最重要的还是看上了华国政府资源这一块。 检测技术是现阶段政府机构潜在用途最广的ai技术,不仅数以亿记的摄像头可以用检测算法智能标注监控的重点时段,还是安全性更上几层楼的高精度实时人脸检测,都是非常庞大的市场。 自己计划明年初去硅谷,想搭上华国官方的线,还是需要借力白度这样的大型互联网公司。 此时的白度不像十年后已经显出很大的颓势,目前白度和企鹅阿狸位列三甲,还是具有很大价值的。 李彦弘所考虑的同样是这点,他对华国官方的了解也远比孟繁岐更深,对其中潜在的机会十分渴望。 既然想要拿下这个方向,疑人不用,用人不疑,李彦弘这点魄力还是有的。 当然了,最主要的还是现在合同都没签呢。 “说白了,你们也没什么可担忧的,我们验收结果通过才会签订合同呢,到时候也是你们自己去审阅代码,复现结果。信不过别人你们还信不过自己吗?” 李彦弘很快调整好了自己的心态,“我们直接持有这样质疑的态度,是非常不可取的。一会人来了之后,我们还是要调整一下,注意方式方法。” 另一边,对这边内幕一无所知的孟繁岐,正准备前往白度的燕京总部。 作为重生人士的他,终究还是高估了现有的检测技术。 第一个真正意义上将深度学习技术应用到目标检测上的,应当是这个月刚刚提出来的r-n,也就是区域检测神经网络。 在传统算法ap值止步于30-40,不再继续提升的情况下,r-n基于神经网络,一举突破了60的ap值。 它的r指得便是区域,检测任务说白了,就是指出物体在图片中的位置\/区域。 而即便在14-15年,r-n系列作为领先的高性能算法,他的推理时间也是奇慢无比的。 采用14年牛津大学的vgg网络作为结构的骨干,需要整整几十秒才能处理一张图像。也就没有了任何实时的可能,只做学术研究之用,难以投入业界。 即便是一两年后,屡次更新,升级迭代的快速版本fast r-n系列,也只有05和个位数的fps。 而孟繁岐给出的算法:yolo。即便在448 x 448大小的图像上,速度也超过了80fps。 如果采用最小的模型版本进行推理,速度甚至可以达到惊人的200帧。 多少人直到十年后,玩游戏的时候显示器都显示不了100帧? 原本的初版yolo技术其实在精确程度上还有所不足,毕竟,作为专注于速度的检测技术,在性能上有所牺牲也是在所难免。 但孟繁岐开始接触yolo技术的时候,都已经出到v4了,等到2023年的时候,甚至都已经到了v7,v8。 很多细节上的问题,孟繁岐就是想犯错都不知道该怎么犯。 最开始记得的就是优化之后的技术。 此时此刻,比较常用的检测技术是dp,30fps性能261 ap,100fps性能仅为160 ap。 而这个月刚刚出来的r-n技术,性能虽然有一个质的突破,来到了50-60,但fps已经到小数点后几位去了,根本用不了。 孟繁岐交出的结果则是,695 ap,82fps,583 ap,200fps。 这已经不能说是普通的超越了,简直是完爆中的完爆。 不过除了在这方面有所疏忽之外,孟繁岐实际上还是在有意识地想要做高这个性能。 纵观自己掌握的所有ai技术,唯有检测是现在阶段变现最快的。 这个功能直接粗暴好理解,易于展示。 只需要接上摄像头,给观众们实时地演示,这项ai技术可以流畅丝滑地检测出屏幕中的桌椅,人物,动植物等常见物体,就能够给观众最为直接的震撼。 像图像生成,语言对话等技术,还需要一定的时间,海量的数据和计算资源来支撑,自己才能够实现这些技术。 而在实际的应用前景上,检测技术不仅是现阶段最容易落地的技术,它的未来前景也非常辽阔。 两三年后搞自动驾驶的企业那是不计其数,如过江之鲫,数不胜数。 在检测上尽力做出夸张的突破,很有助于此后自己在这个方向上的历史地位,说白了其实就是更容易忽悠到钱。 只是他第一次把握刀法,经验不足,没有切好。不慎导致比较专业的人士对此有所误会。 第51章 话语即权利 燕京电力大学距离白度总部步行也用不了一小时,打个车十分钟就到了。 因此孟繁岐倒也没有着急,而是先跟韩辞继续对了一下ppt和演讲的切入角度。 大约又过了四五十分钟,内容基本上就对完了。 孟繁岐不得不感叹,聪明人就是聪明人。即便是自己不熟悉的领域,也能很快理解对方的逻辑和思路。 刚刚过去的四五十分钟里,大约有一半多的时间,是由孟繁岐在讲述自己前面的ppt是怎样的脉络。 为什么要这么做,是想展示和对比什么之类的。 韩辞基本上是一听就懂,孟繁岐很多时候都怀疑,自己是否真的需要把话说完。 而后的二十分钟左右,韩辞询问孟繁岐确认了一些问题和细节,随后便很快地将自己的内容和逻辑说了一遍。 孟繁岐非常仔细地思索了一番,愣是找不出什么问题,只得作罢。 回到自己熟悉节奏的韩辞洋洋得意,心情大好,感觉智商又占领高地了。 一向有些怕麻烦,对大多数事情都常常提不起劲的她,今天甚至觉得去白度总部还挺有意思的。两人便决定同去,待白度那边的事情结束后再一起吃个饭。 毕竟来一次北五环,距离不算近,既然见了,就多聊聊,把事情确定清楚。 发了个消息沟通了一下,白度那边的答复很快,两人便准备现在过去。 “说起来,我还真没去过白度这样的大公司呢。”韩辞对科技巨头的办公楼还是有些好奇的,“看影视剧里,这种大型企业总是那种人山人海,却井然有序的感觉。” “这就是你的一厢情愿了,咱们总是特别希望事情是有秩序的,一直选择性地遗忘或者忽略,人越多只会越混乱。” 孟繁岐说这话自然是自己几度周转于大厂之间的体会了,“表面上看上去有条不紊,实际上里面全是无头苍蝇。当然了,公司的高层其实也没有那么在乎,或者说他们没有那个精力去在乎。 谁知道呢,只要下面的员工整天忙忙碌碌,挑灯夜战,他们就心满意足。” 即便是这个时期,2013-2014年左右,谷歌这样的美国巨头企业就已经开始一定程度上允许居家办公或者比较弹性的工作时间安排。 在谷歌开给孟繁岐的意向书中,更是特事特办,完全给与了他读书和创业的自由。 只是研究成果的汇报需要按时,研究成果的数量有一定的指标。 这说白了就是后来大家经常说的什么okr管理方式,只关注你的任务和关键指标有没有完成。对于你具体的时间安排和工作方式,不做过多的干涉,是一种比较人性化的管理手段。 但根据孟繁岐大厂辗转两三次的经验,国内直到2023年,互联网公司的管理办法还是非常注重加班坐牢。 “其实最恐怖的就是那种没有自己生活的人,如果说资本家和公司高层喜欢看员工加班是情有可原,能够理解的话。 员工自己由于没有爱好,没有兴趣,没有想做的事情,也没有今后的人生规划。不在公司没有事情做也没有地方去,因此整天在公司坐牢,诱发内卷的情况,这才是最悲哀的。” 这种同事孟繁岐碰到的也不是一个两个了,其中有一部分是恶意内卷,有一部分其实并没有恶意。 他也曾拜访过其中一两个老哥的住处,经常就是一两千出头的小隔间,或者二十平左右的蜗居。 里面除了简单的床被衣物,其他的东西基本上什么都没有。 食材厨具,基本为零。家具物什,一切从简。 甚至有一位老哥家里,连招待孟繁岐用的第二把椅子都没有,只得临时找了个纸箱抵用。 如此一来,孟繁岐其实也能够理解他们为什么总是待在公司了。 不管是的水电,公司的餐饮,保温,甚至于零食和网络,哪一样都比家里的出租屋舒服多了。 要是能在公司圈个五平米,孟繁岐毫不怀疑,这些人甚至甘愿直接原地住在公司算了。 孟繁岐换了个视角把这些事情说给了韩辞听,韩辞听完之后欲言又止了两次。 对于养尊处优,一路成长都顺风顺水的她来说,这种极度匮乏的精神世界和物质条件是无法想象的。 孟繁岐笑了笑,拉开出租黑车的门让韩辞上车。“你听到这里可能会觉得他们特别可怜,但你再一想,白度企鹅和阿狸崛起的这段时间,多少人搭上了互联网的快车,实现了财富自由。几年的努力换了一线城市两套房。” “我们国家其他更加辛苦的行业还有多少,采煤,冶金,工程,土木等等等等。程序员的那点苦跟他们相比,算得上什么?但所有的这些苦难都只有被看见的时候才有价值。” “话语即权利。”韩辞总结的这句话是法国哲学家福柯在其就职演讲《话语的秩序》中贡献给世界的一个最强隐喻之一,也是最为有力的哲学命题之一。 这一命题把话语看成是对社会实践主体具有支配性和役使性的强大社会力量。福柯把这种力量定义为“权力”,并由此得到了一个着名的哲学命题:话语即权力。 “这个现象在互联网的时代尤甚,我个人觉得,从iphone4s之后,我们的互联网就从pc端开始往手机移动端转移了。在今后数年时间内,互联网会伴随着移动设备持续下沉,直到绝大多数国民都使用上智能手机。” 韩辞拿出了自己的iphone5s银色款看了看,她的确很喜爱自己的新款苹果手机,但确实从来没有仔细思索过它到底会对社会和世界产生什么样的影响。 “不过移动支付确实很方便,我现在身上基本上不带什么零钱了。”阿狸在2013年强推移动支付和互联网金融,潜移默化之间,已经影响了几亿人的消费习惯。 “我现在要去展示的,也是专门针对手机这样移动端的算法技术,主要是检测拍摄到的影像内存在哪些物体。” 扯了这么多,孟繁岐才想起来,还没有把一会具体要做的事情告诉韩辞。 第52章 亲自迎接 不多时,两人便到达了白度燕京总部附近。 燕京的白度总部大楼,建设得比较早。比起白度企鹅等公司后来在深圳的摩天办公大厦来说,高度上差了很多,燕京这里的总部大楼只有六七层高。 韩辞远远看了几眼,稍有些失望,“远远没有我想象的气派。” “哈哈,怎么算是气派,非得二三十层高,还得很有设计感?”孟繁岐笑道,这种说法和感触,一听就是缺乏实际体验,“要我选的话,肯定还是这样六七层的宽阔办公楼好。” “二三十层,筷子一样的瘦长建筑,中枢给你配6部电梯都远不够用。找个人动辄得上上下下,每次电梯里都挤得跟玉米棒子似的,颗粒饱满,满满当当的。动不动就超重,一班电梯等三趟不一定能上去,六七层多好哇,三分钟就算跑楼梯也差不多到顶了。” “说得有模有样的,怎么的,你在里面干过?”韩辞微微皱眉,总觉得说起这件事,孟繁岐的反应有点奇怪。 孟繁岐嘿嘿讪笑一下,不再继续吐槽。 他的确也是有感而发,前世虽然没有在白度燕京总部任职,但在尚海漕河泾曾分别入职过白度和比特跳动一段时间。 在熟悉的科技园区内说起工作相关的事情,忍不住便多嘴了几句。 对比之下,孟繁岐觉得白度的总体工作强度和内卷程度在大厂中还算是比较轻的,当然给得也相对少了些。 白度的一楼前台相当辽阔,层高得有接近三层,进到内部来看还是相当气派的。 刚一进来,就有前台负责接待的员工上前询问,“您好,请问两位有什么事情?有预约吗?” 此时预约的管理系统还没有那么智能,很大程度上还是需要依赖人力沟通,孟繁岐将情况说明之后,前台小姐姐便开始查询记录,查看接待人的姓名。 看到查询结果,李彦弘三个大字,她脸色稍稍一变。 她入职还没几周,从来还没直接跟ceo办公室的人直接接触过呢。 关键是眼前的两个人怎么看怎么年轻,感觉最多也就20岁左右的样子。 他们真的是直接和李总有约?前台员工心里嘀咕着,手头上却还是不敢怠慢。拿起座机拨通了ceo办公室的内部号,很快,对面就接起了电话。 “ceo办公室,柳秘书。” “柳秘书,您好,这边楼下来了两位年轻人,说是和李总有约。我这里跟您核实一下。” “两个年轻人?”柳秘书一时间没有反应过来,李彦弘平日里接见的人咖位都不小,不说年纪多大,但至少也是一个团队过来,少说也有个。 最近好像也就只见了一次旁边燕京电力大学的那个本科生,算是年轻人。 快速确认了一下姓名之后,柳秘书很快转达给了李彦弘。 楼下的前台员工,不敢怠慢,连忙请两人到旁边的休息区先坐,准备了一些茶水,并告知两人很快会有人下来接他们,请两位耐心等待。 “这待遇还真让人有点不适应啊。”孟繁岐轻轻说道,以前他去别的大厂拜访,哪有这般待遇。都是前台签个字之后,自己联络人下来接。 领个路,准备一杯水,不是什么难事。关键是从前台这位姐姐的态度和语气中,感觉到的那种尊敬,还真让孟繁岐不大习惯。 再等了没有多久,很快便有几人下来。为首的李彦弘穿着熟悉的西裤衬衫,胸口标着白度的logo,昂首阔步。 身边跟着两位一看就身份不低的中年男性,似乎是管理人员又或者是深度学习研究院的技术人员。 再侧旁,还有一位看上去颇为漂亮的青年女性,孟繁岐猜测应当是秘书一类的角色。 “哇!你看!李彦弘!”韩辞等了一会,有些无聊,突然看到了一位知名人物,仿佛哥伦布发现了新大陆一样,连忙轻声提醒孟繁岐。 “真没想到这一趟来还能看到这样的知名人物。”韩辞平时生活里接触到的,咖位最大的人就是鄂院士了。 按道理说,鄂院士的社会地位肯定不在李彦弘这样的企业家之下。但在知名度上,终究还是差了不少。 “我记得他现在是华国首富?”反正也是闲着,韩辞掏出手机准备查询一下。 但刚刚解锁,就发现这一行人的去向,似乎有些不对劲。 “他们怎么笔直地冲着我们走过来了?”韩辞左顾右盼,两人所坐的位置周围还有几批来访者。但似乎他们也非常惊诧于李彦弘本人的出现,并没有起身相迎的意思。 “因为他就是来找我的呀。”孟繁岐轻声答道。 “你不是说来白度交接一下你的新算法吗?”韩辞无语住了,她完全没有做好直面李彦弘的心理准备。 突如其来,有些局促。“我好紧张啊!” “是来白度交接一下算法,只不过直接对接的是李彦弘啊,好像逻辑上没有什么问题。”见几人已经逐渐靠近,孟繁岐也站起身来。 “他们是来跟我对接的,你紧张什么,一起认识一下就好了。” 眼看着孟繁岐开始动身向前迎去,周围的来访者和员工们也都非常惊讶。 “哇我还是第一次见到李总本人唉,都工作大半年了。” “你才干了大半年,我都快两年了,也只在年会上远远见过一两次。” “那个年轻人是谁啊?有人认识吗,李总亲自接见,搞得这么正式,是什么人物?” “这么年轻就有这样的咖位了,天哪,完全看不出啊” “只有我的关注点比较奇怪吗?他身边那个年轻姑娘好漂亮” “李总,我们先上去说。”孟繁岐快步上前,跟李彦弘握了握手,“这位是我的论文合作者,燕京大学的韩辞,今天我们本来在对一些内容,突然接到李总的电话,她也没地方去,就一起过来了。” “无妨无妨,能和你合作论文,想必也是一位杰出的青年才俊啊。”李彦弘闻言对着韩辞笑了笑,“介绍下,这位是我们研究院的常务副院长,余恺,旁边这位,是我们算法方向的首席技术官,汪海峰。” “你的结果给我们的震撼非常大啊,你一来,我们研究院的高层可以说是倾巢出动了。”李彦弘笑着打趣道,随即转过身来对两位同事说,“这位就是我跟你们说的ai技术天才,孟繁岐。” 第53章 这不科学啊 “余博,汪博,久仰,久仰。”孟繁岐跟两位算法负责人依次打了招呼。 李彦弘说研究院高层倾巢出动,有些夸张了,但这两位确实是重量级人物没错。 尤其是汪海峰,一直在白度坚持深度学习领域,后面更是做到了公司首席技术官(cto)的位置。 在文心一言发布会上,他的出场介绍甚至稍微拉回了一些白度暴跌的股价。可见其技术地位还是不低的。 “今天过来主要是演示一下算法的效果?”孟繁岐还不清楚白度这边的心理活动,只以为是要展示一下效果,说一下目前的接口状况。 “代码我稍微整理了一下,今天给几位展示一下推理的速度和性能,至于李总或者两位有什么问题我们现场直接沟通就好。” “没问题,我们检测方向的研究人员现在手头的工作全停了,都在等你呢。”汪海峰笑道。 “啊?”孟繁岐先是愣了一下,随即才反应过来,倘若自己的结果属实,这群检测算法的研究员这两年大部分工作基本就算是白干了。 这就像是货币贬值,听闻手上的美元马上要变津巴布韦币了,还干个p的活,歇着都。 一行人来到六楼,刷卡进入深度学习研究院的区域,只见有一小组研究人员正眼巴巴地盯着这边,眼珠子都快瞪出来了。 “我们去那边那个会议室,我们内部先看一下展示。”李彦弘指着角落里一个全透明玻璃的房间说道。 “没问题。”孟繁岐一边说着,一边开始从包里将自己的电脑往外掏。 这次提前来白度总部,肯定是不可能展示技术细节和代码的,因此还是要用自己的设备。 既然合同还没签,当然给这三位高层看看就够了,没必要管外面那些小兵。 白度这三位领导都是做事雷厉风行的性格,也没有什么指使员工下属的习惯。 柳秘书被留在了外面,进房间后,三人一个在整理桌椅,一个在调整显示器,李彦弘更是亲手协助孟繁岐连接设备。 这种比较技术化,管理气息不是那么弄的氛围给人的感觉还是不错,比颐气指使员工做这做那拉好感很多。 “这次给三位展示的,主要就是上次图表中的数据结果。我们现场运行现在国际论文常用的检测类数据集,在不同的图片分辨率上,跑一下我之前提供的两个版本的模型。” 数据表格么,毕竟不那么可靠,谁今天都可以写个表格做个ppt声称自己的检测速度已经达到几百fps,并且性能还有重大突破。 所谓的chatppt就是如此,提前准备一些图片,视频。就能假装自己做成了语言智能,骗人去投资。 骗过一些不懂技术的有钱人,确实有机会。但想要瞒过面前三位专业技术大牛的眼睛,可就没那么容易了。 “跑得是voc检测数据集,对?”余恺曾经在voc竞赛中夺冠,自然对这方面非常熟悉,“07年的还是12年的?” “我是用07+12年的训练+验证数据去训练的模型,测试使用的是07年的测试集,我们现在展示所使用的数据也是07年的测试集,12年的测试数据官方并没有公布。” 孟繁岐对答如流,让余恺心中非常动摇,这么看来,对方至少确实很熟悉检测类的数据。 “好,你现在运行一下模型,对07年测试数据大约5000张左右的图片都做一个推理。我们看一下你算法的运行速度。” “没问题。”孟繁岐今天来准备的就是这个内容,自然已经万事俱备,只欠运行,“我们先跑一个320x320分辨率的轻量版本。” 说到没问题的时候,孟繁岐已经按下按键,程序开始推理了起来。 进度条飞速地暴涨,等孟繁岐这句话说完的时候,几乎已经来到了百分之30的地步。 “卧槽,这么快?”余恺当场下意识地带了口头语。 5000张图片,说多不多,但要用现在的一流算法r-n去推理的话,几个小时是做不完的。 而孟繁岐运行的算法,每秒处理的图片数量高达200多张,二十多秒的时间,就已经把所有的图片推理完成。 百倍的差距,听起来没有那么夸张,但以时间去感受。数小时和几十秒,给人的感觉是更加震撼的。 “好!好啊!”李彦弘狠狠地拍了一下自己的手掌,大声叫好。“这个速度太有冲击力了!” 汪海峰则紧皱眉头,苦思冥想这到底是怎么做到的。 余恺,汪海峰都在思索细节和原理,只有李彦弘已经想到了发布会。 等到时候,在发布会上,自己ppt左边摆一个世界顶级检测算法的推理视频,右边,摆上孟繁岐的算法去推理。 左边几秒钟才处理一张图片,框追着人走。 而右边,则眼花缭乱地一秒钟闪过几百张,纵享丝滑。 再来一个数量的对比,给定五秒钟的时间,左边可能只处理一两张,右边则直接来到一千多张。 忽略性能,拿最快的版本去和比较慢的一流方法对比,一下子百余倍就变成了千倍的速度差异。 一张图片,对比密密麻麻的一千张图拼在一起。这种视觉上的对比和震撼,实在是太爽了! “真想马上开发布会!”李彦弘的情绪上来了,发布一款实打实超过业界顶尖水平百余倍的技术,这是他人生中最大的乐趣,只可惜这样的机会并不多。 不得不承认,这个快速完成的进度条,比单独几个数字给人的冲击感强太多了。 “这特么的不科学啊!”汪海峰想了半天,“这实在是不科学。能看一下你检测的结果吗?” “没问题,我推理的时候都存在目录下的文件夹里了。可以看到这里的创建日期就是刚才。”孟繁岐点开路径下存放的检测结果,缓缓地一个个滑动。 图片上各个选框精准程度很高,漏检误检的情况大幅减少,综合来看,远比白度现有的算法要强上很多。 余恺和汪海峰面面相觑,都从对方的眼神中读到了相同的东西。 “这是个什么鬼天才啊?” 第54章 实拍实测 “这特么根本不可能啊”余恺还是不能理解这个恐怖的速度提升,“你这里应该是使用了自己新提出的drea?” “是的,我提出的残差网络对性能的提升有非常大的帮助,这种帮助是具有普适性的。并不是只有分类任务,在检测分割还有其他类型的任务上,都有非常强力的性能提升。” “但如果想要做到这个运行速度,你实际上也没法使用你论文中提到的,50层,100层?” “那是当然,对于快速检测算法来说,没有必要使用过于深的网络结构。18层或者34层的版本就已经足以负担大多数需求了。” “不对,这不可能。”余恺拿出李彦弘带回的drea论文复印件,仔细验算了一遍drea18层和34层的参数量。 “对于这个参数量的网络来说,你最多也只能做到每秒3-5张图片才对。”余恺算来算去,还是根本对不上结果。 孟繁岐本想解释一番,说巨额的速度提升来自于检测端的创新突破,而不是骨干网络。 yolo方法不做滑动窗口,也不去提出可选区域,而是直接对整个图片做回归。 这样的做法泛化性能很好,对不同类型不同场景的图片性能波动不大,但是在比较精细的事情上稍有欠缺,比如较小物体的检测和绝对位置。 但刚一想开口,又觉得不大保险。 眼前的两位技术负责人都是高手中的高手,自己言多必失,若是点醒了别人,那可就大事不好了。 “具体的结果已经展示给几位了,算法的细节和原理,现在这个阶段肯定是不方便和几位细聊的。”孟繁岐微笑应道,“如果你算出来不可能,说明你的前提就错了。” “对我个人来说的话,其实这个成绩还有很大的优化空间的,只是我目前的主要兴趣并不在这个方向上。” 听听,这说的是人话么! 汪海峰刚想说点什么,闻言一时语塞,当场噎住。 他这两年检测算法搞了不少,距离这个结果还有十万八千里呢,结果眼前这人说得这叫什么话? 目前对这个方向不是那么感兴趣?那你倒是怎么在提升检测精确度的同时还给他加速了一百多倍的? 随便写了点是?气不气人呐? “你后续会负责继续对这个系列算法进行优化吗?”李彦弘非常关注这件事,如果孟繁岐答应持续优化升级这个系列,其实就会起到一个类似招聘的效果。 “那这个就要看我们合同具体怎么签了。”孟繁岐打起了太极,合同没看到,这种事情自然不好说。 李彦弘靠在椅背上,左手扶着下巴,开始了沉思。 孟繁岐不怀疑李彦弘在ai方向的投入力度,从2013-2023的这十年,李彦弘累计投入了超过千亿在ai方向上,平均下来每年都有上百亿。 即便从每年的经费里面匀出来百分之一,也都够自己吃得饱饱的了。 “我们自己这边也有一些图片数据,方便挪过来做一下推理吗?”汪海峰问道。 “没问题,都可以的。”孟繁岐听了这句话,顿时警惕了起来。一般来说,要求算法直接在自己的数据上推理听起来很正常,但实际上是不大合理的事情。 数据不同,图片里的种类很可能完全不是一个东西,自然也就无法检测。 需要对应的训练数据来微调一下模型,才比较合理。 结合前面两位技术人员的质疑态度,孟繁岐开始怀疑,今天突然被叫到这里来,是不是因为有人根本不相信自己的结果。 虽然有点不爽,但倒也可以理解。 孟繁岐从自己的包中直接掏出了一个外接摄像头,“或者直接接一个摄像头也可以,我们就不花那个力气挪动数据了。” 电脑直接插u盘是有一定风险的,这也是为什么后来许多大厂的主机根本不允许员工或者其他人员外接任何设备。 白度两位技术人员的多次质疑,让孟繁岐的回应也变得谨慎了起来。 之前和李彦弘的沟通太过顺利,导致自己先前的心态有些儿戏了,对待这种重大的交易,还是需要更加谨慎一些。 “你已经提前做了相关的测试,添加了接口吗?”余恺这下心里完全没底了。 外接一个摄像头是最直接粗暴的做法,所有人都可以实时地看到检测算法在摄像头所拍内容上的效果。 这个东西想要作假,几乎不可能了。 刚才自己眼神示意汪海峰提出用白度自己的数据测试,其实潜台词无非就是,孟繁岐可能提前使用这部分测试数据在自己的模型上进行了微调。 说白了就是作弊,让模型先学习过了这些即将用作测试的数据。看完了参考答案再答题,分数自然可以突飞猛进。 而外接一个摄像头实拍实测,就相当于第三方考官现场出题,压根就没有了作弊的机会。 由于之前已经做过测试和适配,孟繁岐没有花费多久就接上了摄像头,并开始运行自己的算法。 举着摄像头对准了白度的三位高层,电脑屏幕的图像上很快就被算法框选出了人物,桌,椅,电脑等元素的位置和类别。 孟繁岐故意晃动了一下摄像头,所有的选框都几乎紧贴着目标物体,丝滑地跟随。完全没有现在检测算法最大的弊病,检测框追不上人的现象。 孟繁岐又举着摄像头四处拍摄了一番,对比较常见的物体,书本,水杯等物体的识别都没有看出什么问题。 此时此刻,即便再想不明白,两位技术负责人还是唯物的,相信科学的。 余恺深深地出了吐了一口气,“这是一个非常恐怖的突破啊” “不知道从互联网巨头的管理视角来看,这个‘恐怖的突破’是怎样的价值呢?” 实话实说,孟繁岐还真不清楚这件事。他知道这些技术的细节和突破的力度。 但时间线稍微一提前,这个东西在白度这样的互联网巨头里能换来多大的价值,缺少高层管理经验的孟繁岐是很不好估算的。 第55章 千金买马骨 “这个算法的结果意义非常重大。”李彦弘表情严肃地在思索,“首先是它的速度,实时的检测将会是各种意义上的质变,别的不提,光说实时检测这一点,它就让自动驾驶这个方向有了技术的基础。” 白度内部在规划ai技术的时候,自动驾驶一直都是李彦弘非常希望涉足的领域。 想让车自动行驶,除了雷达类型的感应器之外,机器处理图像的能力也不可或缺。 并且,这种能力必须要是实时的,而且需要非常的流畅。 “在目前检测算法的速度之下,一两秒往往只能做出一两次判断。我们假设一个自动驾驶场景,视觉算法首先误判了一到两次,那造成的操作延迟很可能达到两三秒。假设时速是60公里每小时,那” 李彦弘想说出一个因为时延导致的行驶距离的不同,因此举出例子之后顿了一下。 “33到50米左右。”韩辞本能地即答,这样简单的计算对她来说就像呼吸一样自然。 “没错,30-50米左右的距离,这里面完全就是生与死的距离。” 李彦弘调整外接摄像头,让它对准自己,随即比较快速地进行了一些肢体动作。 张开手臂,下蹲,跳跃等。 检测算法的选框始终稳稳地锁定在他的身上,随着他的动作丝滑地变大变小。 “并且它在检测能力上没有做出什么牺牲,反而有着极大的性能飞跃。我实在是非常惊叹,无法理解你是怎么做到的。” 李彦弘由衷的赞叹道,他想象过这个级别的检测算法,只是以为可能还需要两三年的时间去探索。 没想到就在几个月的时间内,深度学习就接连进行了多次突破,并且全都出自面前这个年轻人之手。 从他建立起白度ai相关的研究机构开始,还没有哪一个技术给它的震撼比现在更大。 这种检测算法,轻量,实时而高性能。单单就是在自动驾驶和安全安防两个领域的作用就已经足够白度取得很高的技术地位,并赚得盆满钵满了。 “而且我注意到,这个算法很少有背景误检测方面的缺陷。”汪海峰紧紧地盯着屏幕看到了现在,这点也让他觉得不可思议。 因为图像里的主要物体和有意义物体,一般都在中央位置,四周通常是背景。 在检测的时候,许多算法容易误判,在无意义的背景中突然给你生成几个选框,就好像那里真的有什么东西一样。 这是可以理解的,因为算法会做很多次滑动的窗口,在图像上进行很多次的检测行为,难免就会出错。 可孟繁岐的yolo方法,不仅速度大幅提升,竟然还能避免这种缺陷,这就让人非常诧异了。 “那么看来,李总还是非常满意这个效果的,我们合作的协议什么时候签署会比较方便?”孟繁岐这一趟过来,东西也都准备好了。 他不是很想过几天再来一次,专门为了签署什么文件。 再有几天,等签证下来,他就准备去澳大利亚参会了。参会之前,还有一场和谷歌的谈判。 “算法非常棒,合同可以签,今天就签!”李彦弘看完算法的演示,已经不再犹豫。“我们单独谈一下,敲定一些细节。” 先前对结果有所质疑的余恺,虽然没有看到论文和技术细节,但面对这种外接摄像头实拍实测效果的验证方式,他也实在是找不出理由说什么了。 这样的测试方式在白度内部也有过很多次,那检测效果,卡得像ppt一样。速度和准确度都差了现在一大截,他们在这方面的进展其实不算缓慢,但距离孟繁岐的结果,简直就是原始人看见了激光炮。 相关的待遇和条款,李彦弘其实已经和两位负责人商谈过了,基于孟繁岐的结果没有水分的前提,两位高层也给出了自己的意见。 李彦弘感觉得到,孟繁岐对于商业上的谈判还存在一些理想主义,有一些以德报德,以怨报怨的味道。 在上次的交谈当中,他特意在量裁比较自由的地方放弃争取,把主动权留给自己。 当时他还有些没有想明白,这个年轻人为什么在这种重要的谈判中显得如此的任性和幼稚。 如今看来,是这种超越性的突破带给他的底气,这种远远领先的技术比一切的谈判技巧威力都要大太多。 如果自己给出的条件和合作方式诚意不够,对方随时都有更多的选择。 李彦弘对这样的心态其实非常了解,孟繁岐这样的合作者,对具体的金额其实不会那么苛求。 只要自己给出的回报大致不差,对方都不会太过在意。若是自己故意给出优厚的分成,就能够换来对方的好感。 比起一点金钱的差额,对方反而更不喜欢麻烦。这样的人在谈判当中,对人性还有着天真的期待,看中所谓的“义气”又或者是“友情”的感觉。 不得不说,李彦弘非常老辣,虽然在上次的接触中陷入被动。但很快还是彻底拿捏住了孟繁岐的交流风格和想法。 “先看看我们目前的草稿版本。”其余几人离开会议室后,李彦弘与孟繁岐开始了第二次单独对话。 孟繁岐也并不是不知道商场无情,许多事情应当在商言商,谈判应当更加理性客观一些。 只不过他有的选,任性! “孟同学,不瞒你说,这次确定条款内容的时候,我们内部还是有许多阻力的。但我个人觉得,这次合作的条款一定要优厚。” 李彦弘这话说得半真半假。 “千金买马骨嘛。”孟繁岐笑着应道,“别人一看,你李总买马骨都愿意花这么大价钱,那真的千里马还得了?” “哈哈哈,说笑了说笑了。我们几个研究院的老人都觉得,今年最大的三个ai视觉研究成果,就是你的drea,生成式对抗和yolo检测技术。” 李彦弘这句夸赞倒不是违心的,“你这要还是马骨,哪里还找得到千里马?谁还敢说自己是千里马?” 第56章 技术服务合同 说归说,笑归笑,重头戏还是得看合同。 孟繁岐方才翻阅了合同的一页,就已经感受到了李彦弘的诚意,又或者说是拉拢之意。 因为这份合同乃是技术服务合同,而非技术转让合同。 这两者的区别还是很大的,技术服务合同,意味着yolo算法只是由孟繁岐为白度提供了技术支持,他本人仍旧可以继续使用以及享受作为算法发明者的所有权益。 孟繁岐先是大致翻阅了一下,这份合同最关键的几点主要是,保密条款,验收部分,收益分配条款,还有违约责任这四点。 保密条款最好理解,白度愿意斥重金获得孟繁岐yolo算法的技术服务,虽然李彦弘为了交好自己,没有选择直接技术转让的形式。 但保密条款里,还是对自己在这方面做了很多限制,这个可以理解。否则白度不就成做慈善的了。 条款中规定,14年6月前,孟繁岐不得公布任何yolo技术相关的细节,14年12月前,不得开源这部分代码。论文与代码公布时,需要和白度联合公布。 这点孟繁岐完全可以接受,白度之所以只限定6-12月两个时间点,一是因为这么长的时间已经足够白度产品化并且占据市场,形成一定的技术和工业壁垒。 二是因为等到那个时候,技术公布反而会有热度,增强这个社区的热度和关注度。说白了就是让广大的技术爱好者给白度打白工。 孟繁岐本人保有技术发明者的权利,但在14年12月前,必须保证,仅能够将技术提供给自己所在的公司,且该公司不得从事任何涉及国内检测相关业务。 “这一条主要是限制我倒卖多次,我并没有这个打算。入职谷歌的话,谷歌在国内也没有这方面的业务和计划。”孟繁岐觉得这个限制合理,也对自己没什么影响。 “验收条款里,刚刚你已经在国际公认的数据集,以及以外接摄像头实时检测的形式为我们展示了算法的能力。这里其实基本上已经算验收完成了。”李彦弘看到他在翻阅验收条款部分,便出言说道。 “但考虑到我们采用该技术,有自己的需求和使用场景,这部分数据现在对外并不公开,你也没有足够的资源去做测试。因此,这部分最重要的性能结果,我们还需要一些时间才能确认。” 孟繁岐点头表示理解,白度自己自然积累了比较庞大的数据,这些内容自己目前的一台组装机是很难负担的,“根据这部分数据的验证结果,是对我们最后的收益分成产生一定影响是。” “是的,我们在内部数据上,对现在一流的算法都做过测试。等到我们审查完你的代码,并在上面完成测试之后,会根据综合情况给它一个最后的评估。” 孟繁岐翻了下后面的收益分配条款,感觉还是比较公平公开,让人放心的。 它上面预先设定了,yolo算法达到什么区间会对应什么分成。 如果孟繁岐对最后白度的测试结果有异议,觉得存在虚假的成分,白度也允许孟繁岐自己前来总部进行训练和推理操作。 这样的话,基本上没什么问题了? 孟繁岐仔细翻阅了一下自己可以产生收益的几项来源,和上次口头上谈的基本一致。 短期内抽成节约下来的研发经费和设备经费的一定比例,长期上,对yolo算法做核心技术的服务和app都进行持续按比例抽成。 如不对算法进行更新和维护,则逐年会下滑,如果持续协助白度优化算法,则维持一直不变甚至上升。 至于算法带来的热度和关注,也有非常详细的对应计算办法,具体到不同网站的不同数据怎么折算。 结算的频率是每季度一次,根据当季白度的财报结果去结算应当分得的收益。 总体来说还是非常诚心并且照顾人感受的一份合同,孟繁岐大致翻完之后非常满意。 就连违约条款中,对孟繁岐的限制都并不过分,只是规定白度有权在孟繁岐违反保密条例的情况下,中止一切后续的收益分成,并要求孟繁岐赔偿三倍已支付款项。 “这些条款我都仔细看过了,没什么问题,现在就可以签。”由于只是孟繁岐单方面提供技术服务,所以这次的签署并不太正式,没有讲究什么排场。 有部分原因也是因为李彦弘察觉到了这件事,因此特意安排在一个更像讨论会的场景。 孟繁岐嘴上说得轻松,但其实刚刚反反复复将二十几页的合同看了好多遍,生怕自己哪里漏掉了什么内容。 如今与白度的合作算是尘埃落定,孟繁岐觉得轻松了不少,总算是有心思关注其他的事情了。 “李总,我看外面不少开发人员好像都在待命,这是什么情况?” 白度的深度学习研究院这时间也不是什么好进来的地方,入职的门槛很高,一年下来工资都开出人均大几十万,怎么一个个的正事不做,全都围在玻璃屋外面看着,搞得像参观动物园似的。 “他们啊?都是做神经网络结构和图像检测算法的,你这两个结果一做出来,他们今年全白干了。” 李彦弘笑着跟孟繁岐打趣,但内心深处其实有几丝苦涩。 “现在都眼巴巴地等着接手你的代码呢,看完之后先消化几天,我计划还是早点开一个技术的发布会,把这个成果的效果宣传出去。” “赶得这么急?”孟繁岐听了有些惊讶,“不先做成app或者什么组件上的附加功能测试一下?” “我们白度目前在自动驾驶,工业检测,安保方面都缺少积累和各类基础资源。根据我们的讨论结果,还是希望通过对技术水平和能力的宣传,吸引一些这方面的领军公司来合作。” 李彦弘近两年一帆风顺,但他一直在技术方面维持着较强的危机意识,积极探索新的可能以及新的业务领域。 “并且,实时检测算法有太多的可能,很多时候我们也猜不到到底什么公司有怎样的需求。尽快开一个技术发布会,是为了展示你算法的多种可能,我们会选取很多方向的图片或者物体来做展示。希望这样的形式可以激发企业们潜在的需求。” 第57章 太diao了吧 也是了,孟繁岐恍然明悟。 检测任务的数据集收集和标注的成本更高,这也是为什么孟繁岐夺冠的大赛,分类图片一千多万张,检测图片才几万张。 目前所有的这些内容全部都是人工去标注。 一张分类图片,只需要标注一个标签,它是什么即可。 而标注一张检测图片,经常需要在上面添加数个,甚至十数个检测框,需要细致到具体轮廓,然后再添加类别。 标注的成本,自然是十数倍的差别。 为图片添加选框和标签的工具也不完善,操作繁琐,就更使得其缓慢。 截止到现在,深度神经网络为基础的检测算法还有展现出什么实际的商业价值,还停留在实验室研究阶段,实际上并没有得到这些大公司足够的重视。 目前商业用的检测算法,还是传统技术为主,并不需要训练数据,而是通过人工设计的滤波器去提取特征。 孟繁岐演示使用的公开voc检测数据一共就几万张,相比日后动辄几千亿的模型参数量,几个t的数据量,这个规模有点像过家家。 此时此刻,就白度内部而言,李彦弘这个深度学习研究院,也只在私下积累了不到十倍的私有数据量,也就差不多二三十万张。 对于白度来说,基于这个本钱,想直接像后来的chatgpt一样,提供一个人人可用的ai智能,那还差了十万八千里。 “李彦弘开这个技术发布会的意图,其实就是伸手要数据。”孟繁岐稍一思索就想明白了,“通过展现这种神奇的效果,诱惑需要工业检测的厂商,需要医疗图像检测的机构,想要开发自动驾驶的车企。” “你们给我数据,我就能帮你们做这个功能。” 李彦弘这是想趁这个技术优势,收割一大波的数据啊! 这小算盘,打得太精了。孟繁岐心中啧道。 这个时间段,这种图片数据的价值还没有得到广泛的理解,借助检测技术的飞跃,白度收割这些图片起来就像噶韭菜。 再过一段时间,就没那么容易白赚了。 “李总,你要是开技术发布会的话,能不能也宣传宣传我这个原作者,给我也打打广告?”孟繁岐半开玩笑半认真地说道。 李彦弘开技术发布会去介绍自己的yolo检测算法的话,可想而知,其关注度还是非常之高的。 都说流量时代,就是一坨屎有了流量都能演男女主角。 李彦弘如果在发布会上,将自己的功劳如实说出,都不需要添油加醋。 其社会影响力,远远比自己发好几篇顶会都来得猛。 君不见,ai技术发了多少《自然》,《科学》顶刊了。关注度完全不如阿尔法狗击败李世石,柯洁。 老百姓不关注那个。 “当然没问题。”李彦弘非常爽快地答应了,“这个技术本身就是你独立研发创作,你愿意匿名,还是愿意来到台前,我都欢迎支持。” “不过,如果要介绍你的话,我个人有一个小小的请求,我希望能够称呼你为,‘白度ai研究院特约研究员’,你看可不可以?” 果不其然,想要李彦弘为自己宣传,在这种事情上,他还是有自己的想法的。“虽然你拒绝了我的招募,没有在白度入职,但是我们的合作关系还是非常密切。有关这个技术,也牵涉到了千万级,甚至亿级的利益分配。” “在技术发布会上,宣传你的身份为我们研究院的特别研究院,这对这项技术的成长是很有帮助的。”李彦弘娓娓道来,把孟繁岐说得一愣一愣的。 “客户知晓技术的创作者是我们的研究员,显得非常有保障,就会对白度更有信心,合作的意愿更强,更稳。” 李彦弘说得好听,但孟繁岐知道,他也是想借助自己目前在学界的名声和势头。 如今ai学界基本上已经普遍有共识,2013年最杰出的ai技术突破,就是孟繁岐的残差网络和生成式对抗网络。 在这个节点上,白度宣传自己为白度特约研究员,并且联合发布了第三个同级别的ai技术突破。 大家很难不把前面两个杰出工作也和白度联想到一起。 毕竟就在短短几个月的时间内,同时产出了这三个工作。 要么怎么说是华国首富呢,这脑筋和小心思,就是灵活。 “好的,没有问题。”自接触以来,李彦弘对自己还算真诚坦荡,虽能猜到他动过些别的心思。但在合约内容上,李彦弘一点也没吝啬,基本上都按之前谈得最大比例来订的分成。 既然对方赏脸,孟繁岐也不好扫兴。李彦弘到时候亲自站在ppt前吹自己,宣传自己。 这点小要求,就当是付给李总的广告费! 内容敲定,合同一式两份,盖章签订。这件事就算是结束了。 相比于李彦弘平常签订合同的阵仗,这次显得相当草率。 但旁观的余恺和汪海峰都很清楚,这次技术合作即将涉及到的产业数量和规模,将会到达一个相当夸张的层次。 逐渐有些被阿狸企鹅甩开的白度,想要打一场漂亮的翻身仗,就指望着人工智能便是第三次工业革命了。 签订完合同,李彦弘和两位高管还有其他事宜,具体代码的交接和讲解,就由研究院的几位资深研究员来对接了。 李彦弘虽然技术上持续在关注,但毕竟基本上很少亲自看代码写代码了。 主要把握一个大方向,细节和实际操作还是交给底下的打工人。 此时此刻,负责接收代码并需要理解基本全部内容的白度资深研究员,王恺,正有些惴惴不安地在门口踱步,既兴奋又担忧。 本次合同签订成功,他需要负责吃透所有的代码和技术细节,交接之后在全研究院去介绍。 面对这样恐怖的性能提升,王恺对自己的实力产生了不自信。这么夸张的速度,如此天才的想法,我真的能够理解吗? 但同时又很兴奋,他将会是首批真正接触到这个技术核心的人。 正如此想着,白度的三位高层已经离开,孟繁岐在里面收拾了一下文件,也走了出来。 “哥!太diao了!”王恺开门见山,他已经把生产式对抗网络的论文反复看了三四遍了,心中惊叹敬佩的感情。 现在又看到了如此惊人的检测算法突破,心中的千言万语只化作了三个字。 第58章 被包围了 “???”孟繁岐一边走,一边把合同文件往包里装,刚打开门,迎面就听到这么一句话。 直接愣在了原地,细看眼前的人,高了自己半头左右,人高马大。 他身着宽松的衬衫和卫衣,有比较明显的训练痕迹。此刻正笑眯眯地盯着自己,肢体动作上显得有些局促。 “你是?”孟繁岐扬起左边眉毛,试探性地问道。 “王恺,哥。”王恺嘿嘿笑着,请孟繁岐在一旁坐下,“请坐请坐,我是具体负责交接代码的。” 王恺说着将自己的笔记本电脑拉到两人中间,“内部账号密码都给你创建好了,你需要把整个项目上传到指定位置,然后得有一些必要的代码注释,介绍和运行方法与流程。 得确保各个部位的代码别人能看懂,所以说今天最后的任务就是让我弄懂整个算法,过一遍这个代码和技术,就算是交接完成了。” “没问题,这个我懂的。”代码交接,内部工具控制版本,代码有什么规范,哪里必须写注释,变量和函数的命名有什么规则和限制,这些东西孟繁岐都非常熟悉了。 更别说,他还曾在尚海的白度就职过,代码习惯上肯定不会犯错,以至于不符合要求。 他花了一周多重新优化了一下代码,之所以需要这么久,很大程度上也是因为交接需要很多必要的代码注释,文档的撰写。 以便别人可以迅速看懂理解。 “王凯歌是,这些东西我还算是了解,注释和文档我都写了。”孟繁岐说着,在王恺的电脑上操作了一番,从自己的github私人仓库拉下了最新版本的代码到本地。 “我简单跟你过一遍整个流程,细节上的东西今天肯定没法全部搞通,我们留个联系方式,以后肯定还需要多次交流。” “是王恺,哥。”王恺有个口癖,见到厉害的人总是忍不住叫哥。配合其魁梧的身材,有些异样的反差。“我跟余总同名,都是一个恺字。” “哦哦哦。”孟繁岐恍然大悟,“你们这不都是硕博生,你至少也得二十五六了,管我叫什么哥?” “今年二十四,哥。”王恺答道,“术业有专攻,代码一道,达者为哥。在我们组内,我属于是弟中之弟了,放眼望去,全是我哥。” “意思是你是最菜的?”刚才三位高管在的时候,孟繁岐总有种领导在的感觉,不是很习惯。现在和王恺这样的普通员工打趣,才更有点工作时的感觉。 “那怎么派了你来?” “肯定是一个笨鸟先飞嗷。”王恺对自己对自己的菜不以为耻,反以为荣,“如果交接能让我搞懂了,那就说明彻底没问题了,整个研究院的人肯定都能轻松拿下。” “还在划,还在划,来听大哥讲解了。”见孟繁岐已经拉下了项目,打开了文档和代码,王恺连忙起身招呼道。 在中气十足的招呼声中,十几位研究成员应声而来,直接将两人团团围住。 “嫂子,你坐这!”王恺见韩辞在一旁站着围观,顿时觉得自己表现的时候到了,连忙起身让座。 “别乱说嗷,我哪有这么好命。”孟繁岐觉得这小子还挺有意思的,“说正事,文档和论文的草稿我这里都给了,这个你们仔细仔细去读,我就不直接讲了。” “今天主要就是说一下主要脉络和逻辑。yolo检测算法,就是you only look once,只看一次。指得是对图片仅进行一次扫描,它的主要速度提升就来自于此。 一个经典的检测方法的流程是这样的:先通过计算机图形学(或者深度学习)的方法,对图片进行分析,找出若干个可能存在物体的区域,将这些区域裁剪下来,放入一个图片分类器中,由分类器分类。 最愚蠢的做法就是用多个尺寸的选框反复扫描图片,后面则是使用一些办法,筛选最有可能的一些区域。这些做法都是两步走的,看一次图片选感兴趣的区域,再看一次图片去为这个区域做分类。 而我的做法是直接将整个图片划分成均匀的多个网格,其中每个格子都可以输出物体的类别和检测框的坐标。物体落在哪个区域,哪个区域就负责预测这个物体。 我的网络输出是一维的,前n个数字代表n个类别的概率,后面x个数字代表x个检测框的概率,最后4x个数字用以描述检测框在图片上的位置。” “那怎么可能会快一两百倍呢?”有思维敏捷的白度研究员出声提问道,“比较注重速度的传统办法会削减提出的区域数量,通常最多也不过千余个。按照你的说法,你至少也需要数十个网格,每个网格又需要数个检测框,这样的话,感觉差别也不是非常大。” “如果我们采用7x7的网格+两个检测框的话,总数量就仅为98个检测框。此外,在骨干网络的设计还有非极大值抑制的具体操作顺序上,也有很大的调整空间。” “那性能应该会受到很大的影响?” “多类的目标应该怎么去做?” “这样的话,小目标的检测应该会是一个难题?” 随着孟繁岐的讲解,在场的研究员们理解越来越深,问题也越来越多。 孟繁岐不得不说,李彦弘的这个研究院确实聚集了一批相当出色且思维跳跃有创造力的青年程序员们。 这才听了没有半小时,就已经能够问出相当有深度,有意义的问题了。 其中有速度提升的来源,参数设置和意义这样孟繁岐很好解释的问题。 也有对小目标检测的担忧,这种确实是yolo算法硬伤的问题。 讨论起技术内容来,时间总是过得特别快,不知不觉两三个小时过去,孟繁岐此行的任务总算是全部完成了。 “走,今天签了个大单子,比我想象的久好多啊。”如此高强度的谈判加技术讨论,他精神上的确有点吃不消了。“怎么说,请你吃顿好?” “去城里。”韩辞微笑着建议道。 其实对大部分女生而言,这一趟下来,恐怕心中很难生出什么好感。前前后后好几个小时,换麦芒这样的来了能无聊死。 不过对韩辞来说,这种专业领域上的才能和专注投入,反而是一件挺加分的事情。 第59章 中和一下智商 对孟繁岐和韩辞来说,两人在燕京长待的地方都相当偏远,想进城不是一件容易的事情。 北五环外,燕京电力大学这位置,说难听些已经算不上是燕京,这里去禾北都比进城里要近。 而燕京和京华这两所中国最顶级的名校,不熟悉的人常以为在燕京的中心,其实也四环外面。 燕京的西北角,北四环和北五环之间,两所大学所占面积可都不小。 彼此毗邻,连在一起几乎贯穿四环到五环,横穿两个校园,要走超过五公里路。 旁边就是圆明园,海淀公园和颐和园,有山有水有庭院。 再往西边去一点,还有两山公园,百望山,香山。登山不错,这个季节的香山红叶也是一绝。 燕京五环内,仅有的两处绿地便是这两所大学附近,以及奥林匹克森林公园了。 可见顶级名校生的待遇有多好,孟繁岐所处的燕京电力大学这里,风起尘扬,呼吸都困难。迎面而来的微风都带有颗粒感。 如何能够想象,出校门过马路就是圆明园,颐和园的美好? 不过两校虽好,却还是离市中心有些距离。 韩辞平日里出门不多,几年来进城里的次数屈指可数。虽然理论上比孟繁岐离市区更近一些,在燕京待得也更久一些,但在此次出行当中,实在也起不到什么导游的作用。 虽然刚刚签完预计每季度分成数千万起步的合同,可孟繁岐空有钱财,却无驾照和座驾。 没车实在是件麻烦事,在燕京这样的大城市还好,等到了资本主义乡下小城,没有辆车实在是寸步难行了。 孟繁岐摇了摇头,把这件事列为了赴美之后必须准备的要紧事之首。 眼下想要进城,两人只得苦哈哈地踏上了地铁,周转两班,终于来到韩辞的目的地,南锣鼓巷。 南锣鼓巷,鼓楼,前后海基本上连在一起,这一圈地方,孟繁岐前世也曾来过一到两次,只是时间久远,印象倒也不深了。 “这地方怎么看怎么像是宰游客的。”孟繁岐边走边看,总觉得两边的小吃小店景点的感觉比较浓,看似胡同的内核上笼罩着一层资本的浮夸。“真要吃小吃,西二环那儿,护国寺,牛街那边会不会更好些。” “南锣鼓巷到什刹海,人称宰客一条街么。”韩辞笑嘻嘻地寻觅美食,听起来不像是不清楚内幕的样子,“我燕京本地的同学都说,在这里花一分钱都是对智商的不尊重。” “知道你还带我来。”孟繁岐倒不是在意这事,就是觉得有些好笑。“明知故犯是?你想不尊重我。” “觉得你智商有些高了,得想点办法给你中和一下。”韩辞说着,就先买了两大根十几块一根的薯塔。“十七八块来一大串土豆儿,这少说也得减三点智力。” “搁这儿玩电脑游戏呢,还减智力。”孟繁岐总感觉现在韩辞没有起初那个高冷范了,总干些脑回路不大正常的事情,倒是越发像麦芒了。“再来两只塑封的烤鸭,智商直接来到盆地。” “哈哈~我要吃文宇奶酪。”韩辞压根儿没接话,领着孟繁岐继续让他花冤枉钱。 “吃完文宇奶酪再去鼓楼西大街吃三元梅园,对比一下是?真有你的。”孟繁岐看着前面活蹦乱跳的韩辞,总觉得哪里不对劲。 这姑娘的画风怎么就突然变成这样了?也太幼稚了? 韩辞今天的表情很多,完全一改平日冷冰冰的习性。此刻听到孟繁岐猜中自己的计划,扭过头来做了一个夸张的鬼脸。 这让孟繁岐始料未及,他可从没有想象过,韩辞会做鬼脸。 把时光定格在那个时候,孟繁岐觉得自己是个无比幸运的人,他重新回到十年前,站在燕京宰客的胡同里,听着一个天才的漂亮姑娘说着根本不着调的幼稚逻辑和话语。 这个时候的韩辞十八岁,没有经历过后来的事情,虽然正在做的事情很愚蠢,但一点也无法掩盖她的聪慧和美丽。 孟繁岐回忆着记忆里,自己996加班,为了碎银几两辗转燕京尚海,每日通勤2-3小时的日子。 想着背起房贷,开始忧虑自己的工作到底能做几年的日子。 又想起自己现在,已经和白度真正签订了天文数字的分成合约,并即将前往澳大利亚和谷歌谈判。 手中攥着今天刚刚签下的技术服务合同,孟繁岐觉得自己的人生从此刻才真正开始,前世的生活只能算作早就死了。 从这一天开始,自己将会有能力和勇气拒绝人生中几乎一切自己不喜欢不希望的事情。 并且不需要提供给对方任何理由和解释。 他天真地想着,一切都会是幸福的,自己也能够使得身边的人幸福。包括韩辞,这个见证了自己人生改变第一个瞬间的人。 孟繁岐对以后的生活其实什么都不清楚,他从未涉足过这样富足的阶层和世界,但他心里并不是空荡荡的,喜欢、好奇、幸运、迷茫、懦弱等等等等,一切都包围着他,一样都没有离去。 回头看看走过的街道,恍惚间他已经记不清自己是从哪条走来的了,适才的体验像是风中的柳絮一样飘散了,只看见刚刚做完鬼脸的韩辞扭过头去。 而后的许久,他曾想,不论如何自己总要再次回到这个地方,因为一切从这里开始,那最终也必须从这里寻回。只是已经逝去的感触永远不会再回来,但这是后话了。 “走,去鼓楼看看。”南锣鼓巷小吃,韩辞买归买,但说到底只是玩笑,当不得正餐。 真的要吃晚饭,肯定不会拿这种糊弄游客的小吃来填饱肚子。 “铜锅儿涮肉儿~”从南往北走完南锣鼓巷,往西看见鼓楼,又从北往南见着了什刹海。韩辞在后海旁边找了家铜锅涮肉店。乐呵呵地又开始卖弄她蹩脚的京片子。 这地在北海北站附近,恭王府边儿上。 孟繁岐便不由自主哼了几句,南山南,北海北。 “还挺好听的,谁的歌?” 刚想回答马頔,孟繁岐突然愣在了当场,这时间马頔还没发歌呢。 第60章 记得要遗忘 要不是有点专业本事,这趟回来偷歌唱勉强也能混口饭吃。 孟繁岐演唱技巧平平,不过嗓音还算适合民谣,摇滚这样的类型。 随便哼几段,哄女生开心倒也够用。 “怎么每次一起吃饭都是火锅。”吃到一半,孟繁岐突然想起这回事来,上回是四川火锅,这次是燕京铜锅,“说起来,你今天怎么如此反常?” “反常吗?我怎么觉得这才是真实的我。”韩辞歪了歪头,如此反问道,“难道真的会有人愿意整天板着脸,不跟人好好说话嘛?” 孟繁岐不作回应,盯着她,眼神的意思是“愿闻其详”。 “如果总是需要反复重复从陌生到熟悉再到形同陌路的过程,人当然会麻木的。”韩辞说得不算清楚。 “你是指你总是走在别人前面?” “算是,当步伐不一致的时候,即便有时不大情愿,但淡出彼此的生活总是不可避免的时候。” 坐在后海旁的涮肉店里,两人一起看着窗外正在逐渐变暗的天色,不知怎么的都有些感慨。 韩辞的话变得有些异常的多。 “2007年的时候我初中毕业,那时候还有写同学录的说法,由于我跳级了,只有我一个人毕业,大家就使劲给我发同学录,我一人要写几十张,属于体力活,非常的劳累。 而我比较懒,因此拒绝了许多人,只填写了少数几张。这倒不是因为我为人多么的高冷,而是我在这件事上比较认真,在留言的那一版块往往会写上满满一整页,如果填得多了,我就会累死。 可饶是如此,写到麦芒那张的时候,我还是太累了,就有点犯懒,思来想去,只写下了五个字,‘记得要遗忘’。那时候麦芒非常义愤填膺,问我为什么到了她这张就如此的敷衍,但对于她这个观点我并不认同。” “敷衍吗?我觉得这并不敷衍,因为这的确是我全部的感悟了。我写记得要遗忘,并不是出于中三年纪的种种情结又或者是摘自非主流的个性签名。我只是单纯地建议,最好早些忘记这些人和这些事情,越是在乎,越是要忘记。 后来我写小说的时候很喜欢用一句话,其实想表达的是同样的意思,‘毕竟这个世界上最简单的事情就是和别人断了联系’。” “这其实只是极具现实意义的一件普通的事情而已,当两个人每天获取的信息内容完全不同的时候,即便两个人再不情愿,发生这种事情也十分正常。因为说到底,要用动词在‘联系’前面的话,一般会是维持,保持。 这就说明,两个人的关系是需要维护的,如果没有共同话题,如果忘记聊共同话题,那就很容易会失去联系,这很公平。 而后我曾经和父母讨论过这个问题,他们说如果想要随时有人聊的话,是需要经营,又或者说是运营的。” “这个词的性质比维护更差了几分,带上了些许功利的色彩。”孟繁岐插嘴道,“可能这就是成年人的世界。 如果说维持一段关系,是因为不忍失去的话,经营一段关系,似乎只是为了某种目的,两个人的关系就成了邪恶的交易。” “再扯回2007年的时候,我觉得大家即将渐渐疏远,最终断了联系,倘若没有在同一个地方学习,工作,这几乎可以说是必然的事情。无非是有的人断的快一些,有些人依依不舍,断得波折那么一些而已。 维持也好,运营也罢,其实都没有什么必要。没有共同的圈子提供活力的话,这种关系就算一直保持着,也会最终流于形式。 后知后觉的人会感叹,早有预料的人会不甘,轻感情者怅然若失,重感情者痛哭流涕。我觉得没什么必要,就提醒麦芒说,记得要遗忘,如果不想感伤的话,还是早些忘了比较好。” “生活的圈子没办法太大,有人进来了就有人会出去,就如同每年换年历的时候写日期会不适应一般。时常六月份的时候才习惯了这个年份,一转眼就到了下一年,等到2013写得顺手的时候,才蓦地发现原来夏天已经快要开始,2014也已经过去一半了。” 孟繁岐如此回应道,心想自己2023年刚写得顺手,怎么就跑来2013年了呢? “倘若一直沉沦在这种不适感当中,一辈子都不大可能走的出来。 有时候我会有这种感觉,那就是不论过程多么难看,等到结束的时候,它总能变成好的,其实并非是这样。 其现象下的本质,其实是所有人对于‘大部分人终将断了联系,小部分人中的大部分终将流于形式’这一事实的不满。” 韩辞有些忧伤地说道,相比于普通人,她确实换过的同学太多了。 成长的太快,就会很容易没有同伴。 “但这件事谁也无能为力。”孟繁岐说这句话的时候,感触可能比韩辞更加深。 虽然很多人毕业后都再也不见,但从朋友圈中,还是能够窥见些许端倪。他们的升迁,婚姻和子女。 “一个人最终的圈子是什么,既要考虑个人的取舍,也要考虑历史的进程。不论是再好的朋友,再不舍的好友,都会因为时间和空间上的各种问题而疏远。我认为这是不可抗力。” “是啊。”韩辞撇撇嘴,应道。 “有些人不想联系,却低头不见抬头见,有些人想常常见面,却根本做不到。这种情况蛮痛苦的,我觉得见不到的还是忘了比较好,所以推荐麦芒记得要遗忘,这样再见面的时候说不定还会有多了一个好朋友的新鲜感呢。” “但我觉得,不论再绝情再冷漠的人,应该都会有这么一瞬间,感叹于天南海北在此相聚的缘分,也会有那么一瞬间觉得大家要是能当一辈子的朋友该有多好。”重新回到2013,孟繁岐对这种缘分的看法都显得乐观积极了不少。 大学同学的确是一种短暂而美好的朋友关系没错了。 “我起初也不肯相信,但生活不就是发现不想相信的事情其实都是真的的这么一个挨锤的过程吗?” 韩辞笑着说道,“所以确实很开心,能够有一个远远走在我前面的朋友,这让我的生活更有动力了。” 第61章 分别 韩辞的这番话是发自内心的。 由于个人的聪慧和父母的期盼,她数次跳级数次转学。 辗转了好几个学校和城市。 从很小的时候开始,她就有了一种模糊的期待。如果有人可以和我一样,不被我甩在后面,或许我就不会这么孤独了。 韩辞并不惧怕孤独,但这不意味着她就喜欢如此,总希望可以多一个选择也是人之常情。 她怎么也没有想到,自己探望朋友和师兄的一次旅程,竟然见证了一个同龄人速度快到离谱的崛起过程。 那个在图书馆和自己一样在看论文写论文的人,七八月后就已经在和李彦弘握手,谈笑风生。 这一次反倒是自己还在原地踏步,显得毫无进展。 后来,她从付院长那里听到一些消息的时候,还只是以为,图书馆遇见的那个家伙会是一位和自己势均力敌的选手。却没想到,对方竟然在短短几个月内直接原地飞升了。 “不得不说,我第一次在图书馆看到你论文草稿的时候,我想的是,见到了一个还算有点意思的人。也没有在意过那次偶遇,谁知道几个月后,我看到的那篇文章竟然会成为世界瞩目的成果,更没法理解,这样的技术突破可以直接与李彦弘对话,签订8-9位数起步的合同。” “都说在风口上,猪都能飞起来,更何况是人呢。”虽然归来之后有不少技术上的成果,但说到底,孟繁岐内心里是知道自己几斤几两的。 “再过一周差不多,就要去澳大利亚了,我隐约有些感觉,你在那边又会继续往前一大步。”韩辞的眼神稍微有些微妙。 虽然说她一直以来都希望有人可以不要落在自己后面,可若是真的来了一个可以遥遥领先的人,她反而心中又生出了这种不知该如何形容的情绪。 “你非常在乎别人人生又或者是事业的进展吗?”孟繁岐微微皱眉,感觉她在这件事上的想法有些执拗。 “这其实是一个无解的问题,因为从源头上,你觉得自己无法等待落后于自己的朋友,因而终究失去了他们。你觉得自己无法追上领先于自己的朋友,因而同样会失去他们。 要不要放慢脚步去等待,要不要拼尽全力去追逐呢?我的看法是你都会后悔。 所有的事情都一样,喜欢上一个人你会后悔,不喜欢,你也会后悔。喜欢或者不喜欢,你都会后悔,但要么你选择喜欢,要么选择放弃,不变的是后悔的结局。 这个世界就是这么荒诞,你因此发笑,会后悔,为这份荒诞而哭,会后悔。发笑或者哭泣,都会后悔,这是一定会到来的结局。” “选择无用,心情的一端到另外一端,人生的高峰到低谷,轻而易举。 可以说没有正确的选择,也没有错误的选择,既然结局总是后悔,也同时意味着没有后悔。” 孟繁岐觉得自己有必要开导一下这个青春期的小姑娘。 “你该如何去定义两个步调一致的人呢,要知道人生又不是读书,绝大部分人都是一年一级。同一个人的人生亦有坎坷起伏,它也不会是匀速前进的。” “我都懂的。”韩辞有些不好意思地笑了一下,“只是本能地会影响到情绪罢了。” “把时间和精力放在提升自己身上才是最重要最核心的,其他的东西都是无用功。”孟繁岐想起自己前世读研的时候打了许多白工,前世在情感上做过一两次舔狗,便顺便分享一下自己人生的经验。 “人和人之间终究是只能靠相互吸引的,约束和一昧的付出都没有办法真的得偿所愿。不管人生的进展是快了是慢了,都不用勉强。你要相信,越来越优秀的自己,一定是有足够强的引力的。” “好,我答应你。”韩辞轻轻地笑了笑,她第一次感觉到原来有人真的可以理解自己,而自己也可以更加轻松一些地生活。 面前的这个男孩,似乎还是和第一次相见时一样,没有什么变化。 即便他的成果变得世界瞩目,即便他已经有资格和李彦弘直接谈技术合作。 但他给自己的感觉,仍旧是一个普通人。这让韩辞开始有些相信,即便他走得再远,也不会真的变成另一个世界的人。 这可能与孟繁岐真正的自我认识有关,因为抛开这接近十年预知的优势,他也只是一个普通的苦比程序员罢了。 一般来说,人一朝暴富,心态很容易失衡,直接飞到天上去和太阳肩并肩也是寻常事。 一飘起来,就容易做出愚蠢的事情。孟繁岐觉得自己在这点上还算是有本分。 重生回来,便宜是占尽了没错,但不能真的把自己当天才了。 内心当中,孟繁岐还是非常尊重和欣赏韩辞这样真正的天赋选手的。 这样的表现,也使得李彦弘,付院长等前辈,和韩辞,唐璜这样的同辈都对他很有好感。 如李彦弘和付院长,会觉得他谦逊有礼,有成绩有天分但是不狂妄,心性不错。 而如韩辞唐璜这样的同辈,又会觉得他有钱了也不摆架子,还如以前一样,始终如一,是个值得深交的朋友。 这倒也不是孟繁岐刻意为之,只是单纯被几年的996工作给打磨疲倦了,现在怎么活都觉得开心。 “签证办好了吗?”逛了这么一大圈,吃完晚饭又沿着后海走了走,两人也到了返程的时候。一周后出发在即,签证这段时间差不多也得办下来了。 再拖久些,就有些危险了。 “都已经准备妥当了,大约再有两天就该到了?”韩辞算了算时间,已经蛮久了。 “那再下次,我们就机场见喽。” “怎么着,这一周多的时间就不能再见了?孟大天才可真忙啊。” “苦命人赚点辛苦钱罢了,你可要替我保密。”孟繁岐这话半真半假,等李彦弘开始宣传了,哪儿还有保密的可能。 “保密可是要收封口费的。” “看上什么了你自己拿呗。” 孟繁岐将韩辞送回五道口站,也没有下地铁,两人相互摆了摆手,这就算是别过了。 第62章 算法宣传片 2013年12月的这次顶级国际计算机视觉大会,时间其实稍微有一点漫长。 会程分为研讨会两天,1-2号,然后是主会程4天,3-6号,最后再是特定话题的研讨会两天,7-8号。 而孟繁岐夺冠的ia-2013赛事,它的研讨会被定于2013年12月7号开展。 因此严格意义上,其实孟繁岐并不需要参加大会的主要部分。 但他也不准备去得太晚,一行人定下的机票在4号这一天。 12月初的前三天,并没有什么特别的事情。 孟繁岐又去了一次白度的燕京总部,这次是因为白度那边的宣传需要。 李彦弘这边深度学习研究院的动作非常之快,很快就研究清楚了孟繁岐方法的要点,并且在自己的数据上已经开始进行复现的尝试。 负责与孟繁岐对接的白度研究员王恺,这段时间频频来燕京电力大学附近拜访孟繁岐,把各种相关知识差不多都吃透了。 孟繁岐还是比较喜欢跟王恺这样比较纯粹的人打交道的,虽然按理说王恺的联络频率稍微高了那么一些,问的问题有时候也稍微超过了合理的范畴,但他的方式方法还算讲究。 既然自己没有什么特别要紧的事情,孟繁岐倒也没有计较太多。 上次签署技术合同后不久,在王恺的积极推动下,白度方面已经掌握了该算法。 李彦弘当即拍板,准备素材,要制作以“实时检测可以颠覆世界”为主题的宣传片。 说得明白一点,就是要展现孟繁岐的yolo算法在各行各业的使用场景。 其核心便是要突出几个方面的特质,用途广,速度快,效率高。 老板一声令下,研究院视觉方面的算法研究员们排排坐,开始了头脑风暴。 他们需要在这些场景的范围内思索需求,收集图片,并在上面运行检测算法。 这些素材再给到下面的市场部门,专门负责去设计文案,剪辑视频等操作。 “首先肯定是自动驾驶方面,路标路牌,车辆行人,这些方面的检测不仅意义重大,而且最符合‘实时’这一特点。自动驾驶方面对实时的需求是最不可或缺的。”汪海峰开了一个头。 “自动驾驶不仅符合主题,而且市场非常庞大,最为衣食住行四大基础需求之一,它的影响范围也最为夸张。并且,它的实现也非常具有智能感,有一种第三次工业革命的感觉。”一位研究员点头称是,自动驾驶的场景展现是最符合主题也最震撼的。 “还有工业检测方面,工业检测可能是缺陷检测,检查次品和残缺品,也有可能是统计和计数方面,比如统计某种材料的数量并计数。”王恺认为,不同的工业都有各自的需求,这方面会是很大的商机。 “不过工业检测,实时的属性没有那么强,许多操作只要在几秒钟内可以得出结果就可以。” “但我们可以强调效率,可以做一个稍短的视频,左边是工人自己点数检测,中间是很慢的检测算法,右边是我们的新算法。加速一下视频,对比他们的成果数量。” “没错,最后给出一个百分比的数字结果,比如什么百分之一百六十的效率提升之类的。” “医疗图像方面也是一个很大的市场,这部分我们肯定需要提到。但对比自动驾驶和工业,医疗图像的分类和检测,实时的概念就更弱了,基本没有什么情况是需要实时识别的。”有研究员提出了这个难点。 “而且医疗有责任和道德问题,我们只能说是辅助方法,不能宣传替代医生,这个需要千万注意。”余恺路过旁听了一会,出声提醒道。 “还有安防检测” “长时间录像的重点时段智能标注” “食物检测” “动物检测” “人脸检测” “行人检测” 众人群策群力,不管是真的有机会马上落地的,还是完全就是画饼,感觉做出来年内基本上不会有人付费买账的场景,全都先提出来统计一下再说。 “今天就先到这里,两天内,每一个方向至少要准备二十张图片检测结果,还有五段摄像头实测的短视频作为素材给出去。” 余恺最终拍板总结道,“图片素材今天就要全部准备好给出,短视频可以稍微慢一些。” 短期内,白度研究院的首要任务就是协助市场和宣传部门把yolo算法的万用性,高性能,和技术的颠覆性给宣传出去。 按照李彦弘的想法,这个宣传片出来的速度一定要快。 ai技术的发展速度实在太快,早一天就多一分震撼。 中长期的计划要看到市场的真实反馈,和各大业界龙头联络和对话之后,才好去制定和规划。 孟繁岐这次来到白度总部之后,倒不是三巨头负责对接了,也不是去深度学习研究院,而是直接被拉去了市场部门。 刚进门就被两个姐姐直接按到椅子上,对着镜子就开始上妆。 “搞这么大阵仗?”孟繁岐大一的时候有一次院内主持的经历,作为男生也是第一次接触妆容,有了这个经历,因此大概明白要做什么。 只是没想到会搞这么夸张,光是在自己脸上涂涂抹抹的就有三位专业人士。 这让孟繁岐着实有些受宠若惊。 “咱们今天要拍的东西还是不少的。”李彦弘分身乏术,本次派出了自己的贴身柳秘书相伴左右。“听李总说,你过几天要去参加国际计算机视觉大会,你走之前,这几条素材必须得拍好才行,马上就准备发了。” “动作这么快?”孟繁岐知道李彦弘一直想在ai方面做出实用落地的成绩,自己的yolo算法给了他最需要东西,但饶是如此,李彦弘的动作也显得太快了一些,这才不到一周的时间,宣传片就要发出来了吗? “先拍张正式的半身照,这个是一定会在发布会上用到的。一会再拍几条讲解算法,写代码,做检测实验之类的素材。最后等李总回来,再拍几条你们交流讨论的素材。差不多就够用了。” 第63章 李彦弘的私人情报 “穿一整套西装有点没必要?”上妆完成之后,孟繁岐被带到拍摄现场附近。 两位工作人员上前来非常娴熟地为他大致量了量身高,肩宽,腰围等属性,并为他拿来了一整套的西装。 看上去价值不菲的样子。 由于工作性质的原因,普通程序员没有太多出席正式场合的需求,不像一些需要经常接触客户的职业,西装是标配。 因此孟繁岐其实两辈子加起来都没有如此西装革履过,并且还是在拍摄的白幕布前和两个打光的大灯之下。 这让他有些不自在。 “不穿西装也可以,上面直接穿一件白衬衫好了。” “这样好些,我习惯多了。” 换好了衣服的孟繁岐走到了两个巨型的打光灯之前,所幸做过院系的主持人,不至于太怯场。 但长枪短炮的各种镜头齐齐对着自己,这让孟繁岐的肢体工作和表情都有点僵硬,有点无所适从的味道。 “别紧张,一回生二回就熟了。”柳秘书笑着在旁边鼓励他。 上次这个年轻人过来,直接和李彦弘谈技术并拿下了那么夸张的分成合同,让柳秘书感觉非常天才,神秘,不像是普通人。 今天却看见了他普通的一面,原来能和李彦弘谈笑风生的年轻天才也会因为几个镜头感觉局促。 这让她觉得距离一下子拉近了不少。 “来,看左边的镜头,稍微摆一个造型。” “对对看这边,表情不要那么僵硬,微笑一下,对,就是这样。” “换一些姿势,我们多拍一些,到时候成片处理了之后你来选一张。” 在专业人士的指引之下,孟繁岐也渐入佳境。由于也不是什么时尚大片,用不上换很多不同的衣服之类的,因此很快也就拍摄完成了。 短视频素材的拍摄难度要高不少,这种有具体内容含义的视频拍摄需要一定的演技,孟繁岐起初的拍摄很不顺利。 不过很快他就找到了精神胜利法,那么多小鲜肉男女明星不背词,板着个整容脸说“1234”当台词也能上电视拍电影,自己又有什么不好意思的? 如此想着,孟繁岐很快突破了心理上的限制,完成了拍摄。 这边的拍摄告一段落之后,李彦弘还迟迟没有过来,孟繁岐在场地内又等了大约四十分钟,李彦弘这才赶到。 “没想到你这边的进度这么快,有些事情,耽搁了一会,实在不好意思。”李彦弘大步走过来拍了拍孟繁岐的肩膀。 “哪里的话。”孟繁岐倒没有太在意,李彦弘的地位在这里,有时候时间不好把控也属正常。 加上这次过来,本就没有约定李彦弘什么时候到场。 “好消息,我最近和美国的一些企业高层沟通了一下,就我们的评估,yolo实时检测算法很可能会引发自动驾驶方面的热潮。” 这件事孟繁岐有所预料,也在他的计划之中。但从李彦弘口中听到这一消息的时候,不由得还是有些兴奋。 21世纪以来,真正的自动驾驶开始于2009年,谷歌秘密设立的自动驾驶研究部门,几年后,华国方面也有不少跟进和成果。 如2011年,由国防科技大学自主研制的红旗hq3无人驾驶车,首次完成了全程286公里的高速全程无人驾驶实验,创造了当时我国自主研制无人车在复杂交通状况下自动驾驶的新纪录。 2013年,白度也有基于比亚迪改造的首辆自动驾驶汽车在乌镇大会上亮相。 不过,这些自动驾驶的研究其实跟人工智能与视觉算法没有太大的关系,更多的还是通过传统的感应器和控制理论在进行研发。 前世直到15-16年,阿尔法狗颠覆围棋圈之后,整个人类社会才真的感受到ai的威力,人工智能因此也席卷了自动驾驶领域。 基于视觉算法的自动驾驶方法才逐渐成为热门。 孟繁岐在计划和李彦弘合作的时候就曾经思索过,原本这个水准的实时检测方法15-16年才出现,被掩盖在了阿尔法狗的光环之下。 如今被自己提前提出,是否也可以提前引发自动驾驶的热潮呢? 根据李彦弘私下与美国一些企业家的沟通内容来看,答案看来是会。 孟繁岐敏锐地注意到,这会是一个让自己资产迅速膨胀的大好机会。 “从客观事实上讲,自动驾驶其实直到2023年都没有能够大规模的投入使用。”孟繁岐捏着自己的下巴,在回忆自动驾驶行业的脉络。 虽然以特斯拉为首的新型智能车企如雨后春笋一般一个劲儿往外冒,这些企业的估值也一个赛过一个的高。 可说到底,没有真正意义上的无人车投入使用,这些智能算法,终究只能作为辅助,无法取代人类。 不过,这并不影响资本圈对无人驾驶技术商业应用以及广阔商业前景的乐观情绪。 阿尔法狗16年引发世界关注之后,人工智能彻底破圈,进入所有人的视野。 就在短短30天的时间内,自动驾驶相关的投资内容,交易总额就翻了四五倍。 “那个时间段,用‘人在家里躺,钱从天上来’形容不算夸张,投资人就算对自动驾驶、人工智能一窍不通,只要听到是自动驾驶的项目,就表现得趋之若鹜,生怕错过了这个绝佳的投资机会。” 以孟繁岐的视角来看,使用“野蛮生长”这个词汇来形容那个时期绝不为过。 大家似乎都认为,乘着阿尔法狗打败李世石的余威,在人工智能的帮助下,三到五年之内实现自动驾驶似乎成为了理所应当的事情。 孟繁岐记得,多家自动驾驶公司以及汽车公司高管曾喊出过3年或者5年实现自动驾驶量产的口号。特斯拉公司ceo埃隆·马斯克也曾表示,2018年就能够推出完全自动驾驶系统。 但随着时间推移,人工智能在汽车领域并没有复现移动互联网对传统行业的降维打击,3~5年内实现自动驾驶,在2023年看来完全成了笑话。 与巨额投资相比,自动驾驶公司没有一家拥有大规模商业化的时间表,想要实现盈利更是遥遥无期,而企业要发展还需要持续投入重金。 孟繁岐摇了摇头,自动驾驶方向他并不会投入多少精力在里面,但既然李彦弘的情报显示,自己提前提出的算法很可能会引发自动驾驶热潮的话。 进去圈一波钱倒是非常不错的计划。 第64章 白度的速度 从2016年夏秋,自动驾驶飞速崛起,到2019年相关企业寒冬,大约有2-3年时间的操作空间。 根据智能水平的不同,自动驾驶主要可以分为六个等级,从完全不智能到完全智能: l0级自动驾驶:没有自动油门、刹车和方向盘,全程由驾驶员控制。 l1级自动驾驶。系统会在一定情况下介入,比如在油门和刹车等功能上进行辅助。 l2级自动驾驶。比如特斯拉的自动驾驶,在某些条件下,系统可以控制车辆的速度和转向。 l3级自动驾驶。在大多数路况下,驾驶员的注意力不需要集中在路面上。不过双手必须放在方向盘上。这个级别的自动驾驶基本上就是截止2023年各大企业的极限了。 再往后的l4,基本上人类就完全无需介入驾驶了,只在极少数的情况下需要干预。 而l5级自动驾驶,人类则完全成为乘客,车上甚至连方向盘和油门刹车也不用装了,完全把车辆当成地铁。 在资本圈的视野当中, 16年ai技术持续突破,已经在围棋这样一个复杂棋类上已经可以超过人类的巅峰大脑。 那么在自动驾驶方向,不说达到l5级别的完全自动,至少l4级别,让驾驶员不用时刻关注路况应该非常轻松? 带着这种盲目的乐观,自动驾驶的相关企业在那几年都迎来了过高的评价。 许多相关企业敷不入出,烧了几年前之后根本拿不出符合期待的产品。 比如argoai,收了大众汽车和福特汽车超过五十亿美元的投资,宣称要做的l4高级系统却连个毛都没见到。 钱全部烧完之后,直接两手一摊,宣布倒闭。 l4-l5路线成为泡影,行业市场也趋向冷静和理性。车企纷纷以l2-l3级别为主,自动驾驶的热度也回落了不少,资本泡沫纷纷破裂。 “目前来说,无人驾驶作为梦想是可以的,作为生意和企业是不可以的。技术不可以决定一切,先进的技术也不一定就可以解决市场的问题。” 多了十年对自动驾驶发展的观察,孟繁岐的结论是,无人驾驶要实现仅依靠视觉算法和单车技术的进步远远不够。 它需要整个城市交通系统的改造重塑,需要整体的终端控制和规划才能够真正意义上的实现。 不做交通系统层面上的改变的话,永远也没法避免自动驾驶的道德伦理问题,那就是究竟算法该不该为交通事故负责。 如果车辆和行人不分隔的话,这个问题估计在相当长的一段时间内都是完全无解的。 做无人驾驶还是要有成熟的商业计划,包括召回的成本等等,而不是一个简单的售卖行为。这个领域孟繁岐只会最近半年到一年进去投资一下,不会关注太多。 不过孟繁岐很清楚,白度在2013年,此时已经启动了自动驾驶相关的研究和计划,自己贸然表达什么观点,李彦弘一定不会喜欢,也听不进去。 自己也没有必要,没有什么立场去提醒对方,事实上,李彦弘这样的企业家,愿意投上百亿在这种技术上总是好事。 总比整天做外卖,买菜相关的app,去剥削小餐馆和农民的钱好多了。 需要与李彦弘一同拍摄的视频素材并不太多,花了大约十分多钟,多个角度拍摄了一些两人交谈,对着一白板的公式讨论的镜头之后,孟繁岐这里需要做的事情就完全结束了。 李彦弘今天后续并没有太多安排,加上两人上次签订合同后没有再见过,便多聊了几句。 “我这边的计划,今天拍完这些素材,最迟后天宣传片就要放出去。”李彦弘办事的风格一向还是非常果断的,“我们前几天已经在不同的平台和硬件上广泛测试了一下算法的性能和适配性。你采用的算法单元还是相当硬件友好的,因此我们这边需要做的工作总体不多。” “你是有意这样去设计的吗?还是无心为之?” “设计的时候确实有考虑过这方面的限制。”孟繁岐记下来的版本自然是经过多次取舍的,他厚着脸皮,脸不红心不跳地把功劳揽入怀中。“宣传片明后天就发的话,技术发布会的具体时间呢?” “大概再迟个三四天,给市场和公众几天的时间去缓冲,我们宣传市场部门也炒一炒热度,尽量把大家的关注度给调动起来。”李彦弘决心在这方面投入比较大的资源,因为私下里他已经拿检测的素材和具体参数,接触了一些大型龙头企业。 对方无一例外的都被这个结果震惊到了。不管是了解人工智能的还是完全不了解的,都惊叹与这个结果的性能和速度。 最重要的,在他们看来,这种智能可以极大地提升效率,节约成本。 这些巨头企业的反馈,好评程度还在李彦弘的意料之外,预期之上。 因此,对于相关的宣传和发布,李彦弘最近几天是频频督促,果断加码。 今天再次见到这个年轻人,他是怎么看怎么顺眼。 “私下里跟你说一声,这个技术,上面的人也很关注,对你的评价很高。”李彦弘一只手搭着孟繁岐的肩膀,将他拉到房间的角落,低声说道。 “上面?你是指官方?”孟繁岐大概理解了李彦弘的暗示,他知道李彦弘一直与政府的合作还算密切,不过他倒是没有想到这么快就会引起官方的关注。 “我现在不好多说,对这个技术在安防和军事方面的潜力很看重。”李彦弘神秘地笑了笑,“你继续把研究做好,不用想太多,别紧张,这是好事。相关的需求他们会找白度去对接,真的有什么东西需要找你了解的时候,他们想必会直接跟你联络的。如果不跟你联络,就没什么事情。” “怎么说,到时候发布会的时候,你要不要自己上来讲讲算法,原理或者背后的故事什么的都行。”李彦弘说完了计划,顺势发出了邀请。 他其实昨天还在跟柳秘书说,孟繁岐会参会,没时间来发布会,但贵人多忘事,今天又给忘了个精光。 第65章 预支千万 “要按刚刚的时间和规划来算的话,应该不大方便了。”孟繁岐婉言谢绝道,“按这个速度,白度的发布会差不多在6-7号的时候,我那段时间还得去参加国际计算机视觉大会,没法去到发布会现场了。” “好的。我把这件事给忘了。”李彦弘愣了一下,笑道,“你接二连三有新的技术发布,drea之后先是生成式对抗网络,又是实时检测算法,我都忘了drea还没有正式公布这回事了。” 在李彦弘的本能感受中,基于drea的成果都到了可以开技术发布会,正式投入商用的地步了。这个残差网络得是很久之前的事情了? 此刻孟繁岐说完,他才反应过来,原来今年的ia-2013比赛研讨会还没开呢。 “行,那你忙。你在澳大利亚展示算法,其实也是对我们这边的一种宣传。”李彦弘想了一下,这样倒也不坏。“我就不跟你多聊了,有情况再联络。” “李总,稍等下,有件事想拜托你。”眼见李彦弘准备离去,孟繁岐突然想到自动驾驶的事情,于是出声询问道。 “你说。” “如果方便的话,我可以预支一部分收入吗?”想要进场搅局自动驾驶,依靠自己的技术了解和技术影响力去钱生钱。现在阶段,孟繁岐最缺少的还是本金。“这部分钱之后可以从分成的收益里多扣一些。” 之前买btc的那几十万,实在是不够看的,即便当初四处借钱,也还远远不够。 “你现在急用钱吗?”李彦弘有些意外。 “不算特别急,但有些投资方面的见解,实在需要启动本金。”孟繁岐原本计划明年年中的时候,整合白度这里两季度的分成,以及谷歌那边的收入再入场。 但如今听得李彦弘的情报,他断定现在先抄底一些自动驾驶相关的股票大有赚头。 这笔钱缺得不算很急,不过拿不到会很亏。 “你大概需要多少?”李彦弘想了大概不到一秒钟,就决定同意。不过预支多少,这个事情还需要再聊一下。 “多多益善,最好不低于八位数。”孟繁岐大概清楚这时候白度的情况。 第四季度营收95亿多,全年净利润一百多个亿,李彦弘光是在技术研发上,今年就投了四十多个亿进去。 毫不夸张的说,以今年李彦弘四十多亿投入的实际收成来看,这个实时检测算法值个几个亿是没有什么问题的。 只不过研发和买技术不是同一个计算方式,孟繁岐也不好狮子大开口。 “这样,我这两天方便先给你预支两千万,年底还可以预支给你一千五百万到两千万之间。”李彦弘这两年蒸蒸日上,由于他注重科技研发,所以资金链方面一直很保守,没什么问题。 以孟繁岐的研究成果质量之高,李彦弘甚至愿意每年专门拨出几个亿来给他做研发之用。若是能给白度出几个残差网络,生成对抗或者实时检测这样级别的成果,他是完全乐意的。 只可惜孟繁岐执意加入谷歌,去斯坦福深造。 即便如此,李彦弘还是愿意行这个方便。“白度每季度会综合财报的情况给你正式的邮件,告知你本季度的分成情况。这两笔预支之后,分成这里就先扣除,直到扣完为止才会恢复正常支付。” “没问题,我明白的。”孟繁岐对这个情况可以说是满意了,“感谢李总的理解。” “这个事情具体怎么做,还有什么注意事项,或者你还有什么要求,你迟些时候再跟柳秘书对接一下。”李彦弘临走之前叮嘱道,“这个事情我会跟她说,她到时候会联系你。不过这个事情就不要对外说了,尽量保密。” 李彦弘完全有这个权力做这方面的操作,但真要传出去,在内部也是比较麻烦的事情。 孟繁岐点头称是,表示了解。 他确实也有一些额外的需求,首先,这部分的钱他就不希望在国内拿到。 自动驾驶的创业潮也好,资金大规模流入也好,美国那边速度要快上半年左右,并且美股市场没有涨停板的限制,也更加刺激夸张。 对于孟繁岐这样有技术内幕,又能发布技术影响一部分行业的人来说,操作空间要大上不少。 其次是因为,国内这方面大规模资金的流动,若是要孟繁岐个人来操作,那是相当繁琐不便的。 加上如今人在国内,他想要办理在美的银行卡也好账户也好,都比较不便,这个也还需要白度这边提供一些帮助。 当天的晚些时候,孟繁岐就接到了柳秘书的电话,可见李彦弘对孟繁岐相关的事情还是颇为上心的。 要走了孟繁岐的诸多证件之后,柳秘书承诺道,会在两天内给孟繁岐办理妥当。 这也亏得孟繁岐机智,之前办理澳大利亚签证的时候,也对美国签证同时进行了办理。 这样使得白度在美国那边的人员好操作很多。 这种情况下,虽然不能够很快地拿到实体的银行卡,但可以先将卡号和安全码发送给孟繁岐。 基本的支付消费功能大都可以使用了。 短期来说,由于这件事情由李彦弘的秘书办理,不存在什么风险,但柳秘书还是提醒道,等到孟繁岐几个月后前往美国之后,还请自己迅速办理新的银行账户,将这个白度给的临时账户中的钱转走。 以避免以后有什么不必要的纠纷。 同时的,孟繁岐也拜托了白度这边,为自己办理了一个美股账户。 这样一来,孟繁岐很快就能够将这笔预支的资金使用起来。 “以后还是要早点准备,把事情办妥。”孟繁岐反思了一下,他之前也不是没想过要开好美国银行账户和美股账户,但嫌麻烦,总是拖拖拉拉。 这次有李彦弘帮助自己,账户的办理和安全都不成什么问题,过几个月把钱转走就好。 要是换了别人,孟繁岐还真放不下这个心。 “机会还是留给有准备的人的,差一点,我就错过这个最好的抄底机会了。” 孟繁岐摇头感叹了一下,随即已经开始在外网搜索自动驾驶相关的企业资讯。 第66章 初次购股 宣传片素材拍摄好天之后,孟繁岐如愿以偿,拿到了自己的美国银行账户和股票账户。 看着账户里面的326万美金,孟繁岐有些恍惚,感觉十分的不真实。 此前,谷歌的意向书中,虽然给出过更加高的数字,但那毕竟还只是意向书。 谈判,签订合同,自己做出研究成果或者签约两三年,再到这笔钱转到自己账户里,还需要非常漫长的过程。 可如今自己预支的这两千万人民币,可是实实在在地按汇率变成了326万美金躺在了自己的账户当中。 他可以随心所欲地以自己喜欢的方式去使用这笔钱,没有任何的负担。 “额也不能说是完全没有负担。”孟繁岐冷静了一下,预支毕竟是预支的,如果后续分成的收益达不到这个数额,还是会有一定的风险。 只不过这个可能性微乎其微,不仅知晓yolo实时检测算法威力的孟繁岐对它信心十足,即便白度研究院的普通研究员,也能够理解它的威力。 也正因为如此,此时此刻,孟繁岐拿到账户的第一笔投资,是白度的股票。 白度此时的股价大约在165美元,从13年6月到14年11月,一年半的时间,白度的股价从96一路飞涨到了246。 此刻它正处于春风得意的时候。 在这个趋势之下,白度重点宣传yolo算法,开办技术发布会,一定能够在很短期的时间内,再往上涨~20左右。 孟繁岐自然不打算长期持有太多白度的股票,虽然他很清楚提前两年的实时检测算法会助益白度良多。 但在自动驾驶这样的新方向,投资的收益是更为夸张的。 不过由于他很清楚李彦弘最近两周的动作,因此先拿白度做一个不超过十天的短线,还是没有什么问题的。 按照孟繁岐的估计,白度的股价在经历这一技术的宣传片和发布会后,从165涨到200左右,应该问题不大。 后续市场会持续看好白度,因此他想要快速脱手这部分股票不会困难。 像白度这样规模的大公司,股票的每日成交额经常在几十亿往上,自己的这点资金进去,翻不出什么水花,也不会有什么异常,引起太大的关注。 不过即便如此,孟繁岐在购股的时候还是分了多次操作,保险起见。 通常来说,这样的举措确实不大会引起别人的注意。但这次却是例外,孟繁岐用来购股的钱,本来就是预支的部分金额,走的又是通过白度在美国的人员办理的账户。 若是白度这方面发觉不到,那才是咄咄怪事。 孟繁岐分批次才买了大约价值五百万的股份,柳秘书这边就已经将情况转达给了李彦弘。 白度当年上市的经历其实并不顺利,05年的时候,还遭到了谷歌的恶意收购。 当时谷歌对进军华国市场这件事情志在必得,收购白度在当时是一条捷径,谷歌方面收购的势头很足,总裁施密特亲自来燕京拜会李彦弘。 李彦弘当时面对的是诸多股东给出的巨大压力,他认为,白度自己上市发展取得的利益要远胜过被谷歌直接收购。 但上市这条路荆棘遍布,许多股东都看中了谷歌许诺的大笔金钱。 李彦弘在这方面花费了巨大的精力和时间,最终才阻止了谷歌收购事件。 同年,李彦弘正式向美国证券交易委员会提交了招股说明书,并实施了白度“牛卡计划”。 “牛卡计划”是一种反恶意收购计划,白度将公开市场发行的股票称作a类股票,每股拥有1票表决权,而所有原始股份为b类股票,每股拥有10票表决权。 一旦有b类股发生外部转让,该股份将立即转为同等数量的a类股。在赴美上市的华国公司中,采用这一股权设置计划的,白度是第一家。 这一行为被外界普遍认为是白度希望独立发展的宣言。 在“牛卡计划”掣肘下,谷歌不得不将已经持有的26的白度股票出售,至此谷歌收购白度的梦想破灭。 谷歌收购白度无望之后而明确将白度树为自己最大竞争对手,这从侧面也说明在当时白度搜索业务在国内前景一片美好。 有着这样的历史经历,李彦弘对自己公司的股份转让是非常敏感且关注的。 看着柳秘书总结出的报告,李彦弘有些无奈地笑了。 “这小子,跑来找我预支了几千万,结果转手就买了我公司的股票。”李彦弘知道孟繁岐只是个大学生,没有什么别的想法,所以没有太在意什么,只觉得有些好笑。 “这也说明他还是非常看好我们公司的嘛。”柳秘书笑着接话。 “我看倒不见得,如果真的是想要长期持有我们的股票,他在协议里直接提就好了。”李彦弘摇摇头,孟繁岐若是只要股份,那他可得乐坏了。 钱也不用出了,全靠匀点股份就能把他给拿下。 “他一点股份没要,又要我们帮忙办理美股账户美国银行,恐怕是想投资初创。”李彦弘不愧是商场的老狐狸,一眼就把孟繁岐的那点想法看得透透的。 “大概是他之前没有想过,自动驾驶方面的反响会如此好,今天听到我说了之后,便想去美股玩一玩。” 李彦弘倒也没在意孟繁岐没跟他说太多,在他看来,只要不是对白度有坏处的事情,没必要多管多问。 “没事,他买就让他买,不用管他。”李彦弘吩咐柳秘书道,“他一共就百来万美金,也没什么别的想法。就是想趁着我们宣传的这段时间,做个短线,捞个小几成呗,技术本来也是他做的,就让他赚好了。” 就算两次预支的,共六百来万的美金全进去,也就白度市值的万分之一到二左右的比例,还远远不到值得李彦弘关注的地步。 他知情就好,一切都在掌握之中。 “哈哈哈,这小子胆子也够大的。”柳秘书也觉得有趣,这学生陡然拿到这么大一笔钱,还真敢全往里砸,就不怕被有心的大佬给操作了。 “抽空提醒他一下。”李彦弘将资料放到一边,他也确实没有料到这一出,“他要是到了美国那边要还这么莽,说不定得吃大亏。” 第67章 消息先行 孟繁岐决定正式参与自动驾驶等初创方向的投资前,先做几天白度股票的短线,进一步扩大自己的资金规模。 一是因为他熟知,直到14年9月为止,白度的股票都在稳稳上涨,没什么风险。 二是因为有自己的技术支持,短期内借助实时检测算法的巨大突破,可以迎来不低的热度,股价很可能随之飙升。 在他看来这波操作稳赚不赔,倒是忽略了大额投资购股可能存在的潜在问题和风险。 这也不能怪他,毕竟作为普通打工人的他,还房贷就够费劲了。 哪里能非常熟悉大额投资方面的种种门道和忌讳。 迟些时候,等孟繁岐将预支的金额全都分批购股完成之后,柳秘书打来的电话让孟繁岐觉得稍微有些尴尬。 从李彦弘那里要来了钱,反手又去炒李彦弘公司的股票,还被人发现了。 不管是长期持有还是短线收益,似乎都显得有些怪异。 不过总体听起来,白度方面并没有非常在意这件事情,反而比较周到地提醒了孟繁岐一些注意的事项。 并建议他在这种大额交易上,可以考虑咨询一下专业人士再做决断。 “白度在这方面还真敏锐啊”孟繁岐老脸一红,一边收拾行李准备出发去首都国际机场,一边在手机上查询着股价的信息。 “其实这时候白度的股价已经开始涨了。”同行的唐璜和刘旭这两天大概也知道孟繁岐在做的事情。 几人准备一同出行,自然也聊了聊这些事情。 两人自己没有什么本金,但将这件事告知了父母。 比如唐璜的父亲,如今基本上接近退休了,每天工作上的事情也不太多,整天就抓着股市看。 手头的炒股资金大约在1-200万人民币左右。 孟繁岐的这个情报,就足够这个老股民在短短一周的时间内,通过股市赚取至少~30万左右的收入。 还是钱生钱特么的容易啊,孟繁岐996工作一年,扣了税和自己的用度,省吃俭用一年也存不到30万。 现在一个情报,一两百万的本金,就能直接捡钱,拿着麻袋就往里装。 “有内部消息的人还真不少啊。”三人已经等在了校门口,等待着剩余三位。刘旭也在自己的手机上查询着信息。“白度的宣传片下午才发,目前一点消息都没有,但你看,已经明显有很多人在买入了。” 今天的白度交易量明显比前段时间的平均值上升了3-4成,尤其以买入居多。 其股价已经由~165左右,偷偷地上涨到了~173。 在没有任何消息的情况下就涨了大约五个百分点。 “怪不得美国那些议员整天买股票呢,手里有什么法案和情报,直接就梭哈了。”孟繁岐也感叹道,自己作为技术的发明人,但也只是跟着大公司喝口汤罢了。 那些高官,议员,直接就是规则的制定者。 买卖股票已经可以算是非常保守的做法了,做多做空甚至可以几倍十几倍乃至几十倍的杠杆往上加。 三百万美金进去,起起伏伏十几倍的变多变少都是常事,算不得什么新闻。 只恨自己没有记住太多这方面的新闻,孟繁岐微微叹了口气,他所能记住的都是些历史性事件,想要频繁靠做多做空翻倍资产还是有些难度。 只能用稳定的办法先慢慢去增长自己的资产了。 “裁判和运动员都是我,你怎么跟我斗?”唐璜笑道,“这时候就只能跳出规则去对付他们了,都说美国是三亿人民枪战的梦想,直接上街零元购,给议员们来一个众生平等。” “哈哈哈。”孟繁岐大笑,“说起来,白度那边的宣传片跟我们起飞时间差不多,到时候上飞机之前可以看一下。” “五点钟?”刘旭查看了一下机票,几人的飞机是17:25分启航。 “这时间选得巧秒啊,马上快下班了,辛苦了一天,大家都无心工作。”唐璜如此分析道,“都不想打工,全跑去吃瓜了。” “李总时间赶得紧,我后来得到消息,发布会时间又提前了,直接安排在了六号下午五点。” “周五下午五点,这个时间绝对是讲究的。但凡是个正常的打工仔,这时间绝对是不可能干活了,全跑去看李总吹牛了。” “真讲究啊,到处都是学问。” “付院长?您怎么来了?”几人正吹着牛,孟繁岐一转头却看到了一个熟悉的身影往这边走来。 “你自己跑去参会,乌泱泱带了这么一群人,我不得来看看?”付院长笑着拍了拍孟繁岐的肩膀,“这里面有三位同学可是我出面才请下来的假,你可得把他们给看好了,别给我走丢了!” “放心放心,您就是放心不下我,还放心不下韩辞吗?”孟繁岐连忙应道。 这也是华国的特有文化了,大学不知道为什么总是要承担家长的角色,对已经成年好几年的大学生其实管束得有些过多了。 “韩辞我就更不放心了,反而是你办事还算踏实些。”付院长此刻心里也有些异样的滋味,好不容易学校出了一个这么好的苗子,这就要放走了。 他很清楚,孟繁岐此去之后,必将一直站在ai界最中心的位置。 孟繁岐与白度的合作,他也稍有耳闻。 从今往后,两人想如以前那般纯粹地一起讨论,分析问题,就不那么容易了。这样纯粹的师生关系,不得不说付院长还是颇为享受的。 学生聪明,有自己的见解,可以出很好的成果。但在一些方面有欠缺,自己能够给他指引和帮助。可以说这是付院长最为理想的学生,最为理想的状态了,也是他当年选择做教授的原因之一。 教书育人这些年,这样的学生屈指可数。 不过,都说君子之交淡如水。虽然内心中的情绪比较复杂,付院长表面上并没有流露出多少。 “去,以你的才能,需要更大的舞台去展现。”付院长清楚,自己如果强留他在学校是非常自私的想法。“不过这里也随时欢迎你回来。” 第68章 着作《规矩》 付院长简短地聊了几句,叮嘱了一些事情,就告别离去了,看着付院长的背影,孟繁岐心中也有些说不清道不明的滋味。 环顾这个前世呆了本硕七年的校园,孟繁岐不知道自己如今对这里到底是什么感情。 这次收拾行李,孟繁岐已经把自己的杂物都送回了家,学校相关的手续也都办了。 启程去澳大利亚参会,同时也是对燕京电力大学的告别。 这次回国之后,他便不会再来这个校园了。 时间上来看,在澳大利亚参会之后,差不多就是十二月中旬了。 孟繁岐准备回家一段时间,正好时间上也快赶上过年了,13年的春节在一月底。 今年年底先把短线做的白度股票出了,抽出一部分钱来,一月份回家把父母的生活,相关的东西全都安置好。 给二老的生活来一个大升级。 等到年后,二月上中,就差不多该前往美国硅谷,入职谷歌了。 而安顿下来之后,熟悉谷歌的团队和环境需要一些时间,很快又是三四月份大学开学的时间。 回家,安顿二老,再到年后初到美国,需要做的事情还是蛮多的,时间上相当紧张,也就没有什么理由在燕京电力大学附近继续呆着了。 其实孟繁岐早就该离开燕京电力大学了,只是一直以来也没有该去的地方,都在忙开发技术和写论文,没什么收入,因此也就一直没考虑离开的事情,一再耽搁。 既然和白度合作的事情已经妥当,光是这一笔预支出来的分成普通人已经基本花不完了。孟繁岐便以出国参会一事,作为自己离开的契机。 燕京电力大学很偏,平日里只有黑车可打,大家大都习惯了。 孟繁岐起先也没有想太多,但自从李彦弘上回透露消息之后,他如今也开始比较关注一些现在还不算发达的产业。 比如说颠覆了传统出租车行业的打车软件。 13年的燕京已经上线了一批叫车软件,其中就有后来鼎鼎大名的滴滴。 “只是这些打车软件前面怎么都加了前缀啊,这是什么神秘的数字?”孟繁岐搜了一下app,易达打车,移步叫车,看起来相当陌生。 “是燕京的电召平台,这些软件应该是统一平台下属的。”韩辞对这个机构稍微有点印象。 “输入终点和小费,然后司机选择来不来,这不就是变相涨价吗?”麦芒很是不满。“打个车还搞竞价。” “打车竞价,已经算是想象力一般的决策了。”孟繁岐觉得这还算是正常人很容易想到的办法,隔壁白度2001年就推出了竞价排名,搜索结果也要竞价。 2001年9月推出,2002年就营收了接近600万。 截止2013年,单个季度的竞价收益都以十亿为单位了。 这种只认钱的竞价排名模式,酿造了许多本可避免的惨剧,孟繁岐对此一直嗤之以鼻。 二十一世纪初,白度全方位追赶谷歌的搜索技术,在中文领域上几乎做到了势均力敌。 而后,白度则沉迷于竞价排名的高额利润,等到2023年的时候,搜索质量已经差了谷歌十万八千里。 尤其是ai方向的资讯和论文,用白度去搜索简直能把血压拉满。 同时,拥有bg大小姐(gpt-4)的微软开始了对谷歌的反攻,可以预见到,白度的竞争力只会越来越小。 不过那都是后话了,并且这些也都是白度自己的问题,将许多好牌都打得稀烂。 这些事情与孟繁岐无关,他与白度和技术合作也只是最多2-3年的短线。 到达机场之后,行李托运的柜台前已经排起了长队。 闲着无事,唐璜给孟繁岐介绍起了几人私下里一同撰写的着作《规矩》,乍一听没听懂,搞得孟繁岐一头雾水。 “《规矩》的制定是为了共同营造一个和谐平等的旅游环境,避免不必要的纠纷和不愉快,促进同行人之间的友谊的同时也对彼此进行了约束,并提供了相应的办法来满足个人的喜好。”唐璜煞有介事地翻出一个册子来念了起来。 “首先,由于你慷慨地负担了我们一行的机票酒店用度,因此你是我们当之无愧的大老板。大老板拥有尊贵的特权,可以决定我们吃什么,点什么菜,什么时候出发行动,甚至可以为每个人安排房间和床位等。”麦芒接在后面摇头晃脑地说道,手中也有这么一个册子。 “那问题来了,我能安排你们两个睡到同一张床上去吗?”看着这两个人一唱一和地耍宝,孟繁岐狂翻白眼。“不是说可以为每个人安排床位吗?” “那不行,老板虽然是老板,但老板不是流氓。”唐璜一脸严肃地回答道,“老板的特权也不得有违公序良俗。” “除了大老板之外,其他人只得建议,不得擅自决断,一切行动听指挥!”麦芒越念越来劲了。“除非大老板明确表示大家自由选择,此时如果有小老板,则按照小老板的意愿行事。” “我看看,什么东西,还大老板小老板。”孟繁岐皱着眉头拿过一册,只见上面写着《规矩》二字,里面条例相当详细繁复,一看就是那几个无聊的活宝干的。 “1饮食篇。规矩1-1:同行时,大老板可以任意选择自己想要吃的餐厅,其他人必须与大老板一同用餐。 规矩1-2:大老板不喜欢吃的东西不得点,如不事先确认清楚,造成后果则罚请客一次。” 而总是违反了规矩,请客吃饭或者门票最多的人,则就是所谓的小老板。 看到这里,孟繁岐大概是明白了,这几个家伙是觉得自己出钱太多不好意思,因此自己在那里瞎闹,制定了这么一册所谓的规矩。 至于这些所谓的规矩,也只是彼此玩闹的借口,出钱请客的借口罢了。 比如这里就有一条,“规矩1-7:若大老板没有意见时询问想吃什么,则以回答得最快的人为准;若无法分辨谁回答得最快,则以声音最大的人为准,若还是无法分辨,则猜拳决定。” 怎么看都非常儿戏。 不过即便如此,搞了接近十页也太特么多了? “一定要给到老板最尊贵的体验!” 第69章 好热度我炒 “还在聊天,还在聊天,大老板的技术宣传片都发出来了,还在聊天。”五点钟一到,唐璜准点开始巡场了。 “这个肯定要扣分嗷,一定得扣,响应不积极,思想有问题。根本不尊重大老板。”麦芒对挑别人的刺这件事情可以说是相当的起劲。 “别催,别催,已经在缓存了,登机要登的呀。”刘旭原本也是规矩的制定者之一,旅行本就是很考验人与人之间关系的一件事,他觉得这个介于玩笑和约束之间的方式可以避免一些尴尬的事情。 但没有想到有两个家伙拿着鸡毛当令箭,直接折腾起来了。他一边缓存视频,一边拖着行李往飞机上走。 白度这个宣传片并不长,算上片头片尾其实一共才不到三分钟。 不过其中的信息量还是相当之高的。 白度这样规模的公司整体动员协作起来,动作很快,各方面细节做得也相当不错。 “这个宣传片其实要的就是一个不明觉厉的感觉,勾起人们的好奇,比较具体的信息和情报全都在周五下午的发布会上。”孟繁岐刚刚已经扫过一眼,宣传片本身并没有什么太多值得关注的。 全是一些图片和视频的组合,为得是突出广泛的应用范围和商业价值。文字非常少,只有两句吹嘘速度打爆世界水平几百倍的文字,其他的都是些高大上的空洞关键词,看不出什么东西来。 关键点还是在于它引发的热度和讨论会如何发酵,孟繁岐还是比较在意自己技术的首次落地推进风评如何的。 宣传片先是以一段和实际检测算法原理基本毫无关系的动画效果展现了一下计算机处理图片的流程,给吃瓜群众的感觉大约就是图片和视频输入进去之后,有一系列非常高科技的复杂操作,然后这么一个带有标注的结果就出现了。 随后是经典对比环节,把友商算法和目前的一流算法掏出来,重点强调了一下检测的速度。 后面则是检测结果的广泛应用场景的一些展示了。 白度将相关的场景又再做了一些合并的操作,主要从“智慧交通”、“智慧工业”,‘智慧医疗’,“智慧安防”等几个主题出发,依次展示了海量的检测结果。 最后给了一个李彦弘的半身大特写,注明了技术发布会的时间地点。由李总亲自发布,亲自讲解。 总体的节奏偏快,一秒钟大概会闪过2-3个检测结果,让人眼花缭乱,目不暇接。 “哈哈哈,不知道的还以为他们已经经过了很久的测试评估呢。”韩辞看完笑道,从那天交接代码到现在,满打满算还不到一周。“唰唰唰闪过去几百张各个方向的内容,要不是那天去了,我都以为白度在这个领域打磨几年了。” “华国互联网企业在这方面确实比较性急。”孟繁岐看了一下,这部分结果展示分了几个板块,总时长大约一分多钟,占了绝大部分篇幅。 估算一下,大约得有2-300张图片。考虑到宣传需要,这些结果多半也是优中选优,作为素材的图片更多几倍,白度那帮人这周估计没少加班。 “宣传片没啥特别的创意,就是纯亮肌肉。”唐璜看了之后觉得没劲,“上来先夸张对比,故意把本来就已经差了很多的检测速度再放大几倍,先把速度这方面的体现拉到最高,后面再放一些慢速检测的结果,虽说没撒谎,但也有故意引导的嫌疑。” “这话确实,我这次结果的提升已经足够夸张了,完全没必要这样。”孟繁岐看完也是皱眉。 在后世用得比较多的yolo算法版本,其实相对现在一流算法的速度提升大概在百倍左右。 它本就是强调速度,牺牲了性能的方法,只是由于被孟繁岐提前了两年提出,导致性能上看起来也有很大的突破。 孟繁岐为了以速度来震撼李彦弘,其实已经特意调整了结构,出了一个轻量版本,这才有了一个大约200倍左右的提升。 结果李彦弘如法炮制,继续在这方面做缩减,直到小小小的版本性能和现在的一流算法基本持平,他才肯罢休。 这个版本的算法,肯定是不会真的投入使用的,为了要那么快的fps而大幅牺牲性能,根本没啥意义。 不过这么做唯有一点好,那就是专门去对比现在以慢着称的r-n检测办法。 以己之长,对彼之短。 和慢的比速度,和快的比精度,经典。 “这倍数直接给他干到一千倍去了。”孟繁岐看得头皮发麻,心说还是李总能吹啊,要么怎么说自己没那个本事创业呢,没那个脸皮。 “还好我这时间有会要参加,否则真到了发布会现场,接在李总后面上台,我这脸皮怕是不够用。”孟繁岐露出劫后余生的宽慰表情,“肯定得露怯。” “到时候百来个镜头对着你,咔咔咔一顿闪,你肯定什么都招了。”马上就要起飞,唐璜抓紧着最后的时间在刷手机。“快看热搜,围脖上热榜已经有了,‘白度检测’。白度的宣传力度还行啊。” “这一看就是出钱上的榜,现在这才多少浏览量讨论量,这就已经到热榜前十了。”慧慧和麦芒都是围脖的重度用户了,属于是在上面有房的。 互联网由pc端往手机端下沉之后,围脖的热搜榜占据了很大的市场份额,后来更是几乎变成了娱乐圈后花园。 除了一些国际大事,上面经常被几个演员歌手偶像的消息反复霸榜。 这个时间段的只乎上面回答的质量还算不错,孟繁岐后来曾经在只乎上看到过贾扬清,李沐等诸多大佬的回答,因此他重点关注了一下这个平台上的相关问题。 不过这个平台上的流量,相比之下就小了实在太多了,估计李总看不上这点蚊子肉。 孟繁岐粗略扫了一眼,大概2-3个相关问题,一共不到30个回答,其中最高赞也就一两百,留言三四十左右。 大部分回答还是持怀疑态度,不过由于李彦弘周五还要开技术发布会,总体的舆论风向还是比较正面的。 第70章 抵达 “李彦弘是真不怕把牛皮吹炸啊,虽然我个人也觉得现在r-n方法有些太臃肿,但要我说,就算抓着最慢的比,白度这次的检测能有个三十倍的速度就差不多了,五十倍顶天了。” 这位一看就是个业内人士,预测的情况相当符合历史发展进程。 不过他后续并没有太多地就技术细节进行讨论,一部分原因是白度宣传片根本就没啥细节,另一部分原因是他的回答显然在诉诸情绪。 “华国互联网企业这种急于变现,好大喜功的毛病真得改改了,李彦弘布局ai的思路没什么问题,我个人也很赞赏。但动辄就要搞个大新闻,虚假宣传,这算是怎么回事?真该给李彦弘泼泼冷水了!” 孟繁岐看到这里哈哈大笑,要说泼冷水,李彦弘后来还真得在物理意义上被泼了冷水。 在2019年白度的ai开发者大会上,李彦弘正说着自动驾驶的自动停车技术实现最后一公里自由的时候,有一位相貌平平的黑衣男子突然杀上台来。 一手抓住李彦弘没拿麦的左手,另一只手将早已拧开的一瓶矿泉水迎头灌下,将李彦弘的头部浇了个遍。 此事比ai开发者大会本身要火爆数倍,此事还衍生了许多有趣的哏,李彦弘获得了一些诸如弘颜获水,水掉哥头之类,古色古香的绰号。 “总得来说,市场的预期远低于我的yolo算法实际水平,这是好事。”孟繁岐抓紧起飞前的最后几分钟扫完了只乎上的第一批回答。 只乎目前的答案不比后来,此时质量颇高,这批人应该是现阶段互联网公共平台上最专业的一群人了,他们的意见还是有一定参考价值的。 “而且差了还不是一点两点。”孟繁岐美滋滋地补充道,都说期望越大失望越大,反过来,期望越小惊喜则会越大。这种反差,势必会在两天后使得李彦弘的技术发布会远比不预热炒作直接发布要火爆的多。 “大老板又要麻袋装钱了是,真羡慕啊。”过了这么久的时间,和大家渐渐开始混熟的慧慧,话也开始多了起来,也有胆量跟孟繁岐开开玩笑了。 “哪里的话,这次的情报我可是给大家都分享了,一点没藏私,不管本金多少,都是至少2-3成地白捡。” 即便不如唐璜父亲那样,能有一两百万在股市,只要二十万进来,收益也在五万左右。同行的几人,家中或多或少也都因此得益。 起步也赚到了小十万,韩辞家中富裕,更是投了五百万进去。 一方面是因为家境的确殷实,另一方面是因为自家女儿切切实实地见到了李彦弘本人。 还合了影。 因此几人喊‘大老板’喊得那是心甘情愿,绝无勉强之意。 上回第一次见,孟繁岐说带大家搞ai分钱,大家都觉得有点玩笑性质,当不得真。 现在看来,先别说ai搞不搞了,那些辛苦钱先不论,光是类似的情报多来几次就够了。自己几个人跟着一年喝两口汤都喝饱了,还打什么工?把大腿紧紧抱住就行了! 说着的同时,飞机上的晚餐已经发放,麦芒选了韭菜土豆煎蛋饼配培根和香肠。 她有点可怜巴巴地说道,“那我把我的香肠给你吃。” 这种幼稚的示好,让孟繁岐不知如何应对。 飞机来到高空,夜色逐渐降临,华国大陆渐渐在飞机后面消失不见。 虽然天色暗淡,看不清云层下的太平洋,但有几人显然是非常兴奋。 截止此时,其实只有韩辞和唐璜曾经出国旅行过。 两位女生孟繁岐不大清楚,他自己和刘旭都是后来才有机会去往国外的。 目前为止,华国有效的护照还没有到一亿本,比起影视剧中的光鲜亮丽,绝大部分华国人其实一直未能离开这片土地去看看外面的风土人情。 能够在没有长辈的情况下,二十左右的年纪去海外旅行,有些许兴奋可以理解。 “好了好了,大家也别闹了,早点休息。”孟繁岐注意到韩辞明显眼睛都快睁不开了,一副相当疲倦的样子,便连忙中止了聊天环节。 韩辞的确睡眠很是不足,她有出行焦虑,第二天要走得越远,前一天就越睡不好。 此次又夹杂了不少对孟繁岐的复杂情绪,使得这个情况更是雪上加霜。 好在这一趟飞机旅程接近十个小时,两地时差也并不多。 孟繁岐当时特意选择了一个下午出发,第二天早上到的航班,可以说考虑相当周到了。 航班落地之后的接机车他也已经订好,几人过了海关之后便可上车直达西尼星城附近的西尼朗廷酒店。 西尼星城是澳大利亚顶级的娱乐之地,拥有世界一流的会议设施和娱乐场所,灵活多变的设计使得它可承办各种活动,包括学术会议、艺术会展等。 国际计算机视觉大会本次地点便在西尼市金鸡湖西尼星城。金鸡湖是一个充满活力的滨水区,距离西尼市中心仅有两公里,有各种企业、商店、餐厅和旅游景点。 横向对比各个会议的举办地点,西尼星城绝对可以算是非常一流的了。 方圆一公里内光是五星酒店就有二三十个。 孟繁岐按照五星和9分+的条件筛选了一下,便只剩下了五六个选项。 最后定在这里的原因也很独特,只有这家五星酒店有三人间。 考虑到此次三男三女却竟然没有确定任何一对情侣关系,西尼朗廷便成了唯一剩下的选项。 一晚五千,两间一天一万,5号-10号小住五天,这就是五万rb进去了。 “两辈子加起来还没住得这么奢侈过呢。”孟繁岐读书的时候就还算节省,工作了自己赚钱之后就更节省了。 毕竟钱难挣,屎难吃,花自己赚的钱更心疼啊。 孟繁岐本以为赚多少都是这样,如今才发觉不是。 原来收入真的超过一定数额之后,获取金钱的难度低于一定界限之后,十几万花出去真的一点感觉都没有。 “我对钱不感兴趣!”孟繁岐在心里念着杰克马的经典台词,带着一些对和谷歌谈判的期待和紧张,迷迷糊糊地进入了梦乡。 第71章 谷歌警觉.jpg 白度虽然尽力做了宣传,但这个方向注定是比较小众的领域,不可能有娱乐新闻那样的热度。 即便是周五李彦弘的发布会能够给出如此突破性的结果,这个热度和关注度也是完全无法比拟阿尔法狗围棋事件的。 不过此时此刻,白度宣传的目标群体本来也不是普通的吃瓜群众,而是具有视野和远见的企业高管以及新锐的创业者们。 对于有心之人来说,这个宣传力度已经完全足够。 这个体量的声音在他们听来已经算是振聋发聩了。 比如早就对孟繁岐伸出了橄榄枝的谷歌。 谷歌在历届顶级会议上基本都有论文发表,因此总会有人出席,不过本次参会的人员当中,有四位却是原本不打算参与的人员。 他们就是辛顿团队三人,和谷歌头号技术大牛杰夫。 说来也有些好笑,去年此时,杰夫还与辛顿以及他的两个学生阿里克斯和伊利亚处于博弈谈判的过程当中,如今却站在了同一条战线上。 按理说,这次谈判有杰夫和辛顿两人便够了,杰夫负责从公司方面,辛顿负责具体学术和专业方面。 只是辛顿的身体一直不好,这次又执意要来,两位学生实在放心不下。 去年在太浩湖和谷歌还有白度谈判的时候,情况其实就有些糟糕,当时太浩湖空气稀薄还寒冷干燥,辛顿在那种气候下经常生病,但他并不希望被几大科技公司的人看到自己「又老又衰」的样子。 这既影响形象,又影响谈判结果。 为了防止自己生病,他想了个办法:把床垫放到两张床中间,他又找了一些像熨衣板一样又长又结实的支撑物加在两张床之间,然后拿几条毛巾浸湿,盖在上面,晚上他就睡在这样的「帐篷」里,保证有足够湿润的空气。 当时白度方面本来是余恺负责谈判出价,但等价格超过2400w美金之后,余恺的权限不够了,白度另有一位高管接手了这一工作。 余恺人在太浩湖,却无法参与进去,心急如焚。 余恺无事可做,会时不时地到辛顿的房间看看,稍微了解一下拍卖的走向,但他不知道的是,他偶尔的拜访也在731房间引发了一些慌乱。 辛顿并不想让其他人看到他独特的加湿室,所以每次余恺到之前,辛顿就只能求助他的两个学生,阿里克斯和伊利亚,让他们急急忙忙把加湿帐篷拆掉,给房间恢复原状, 在这个只有三个人的公司里,辛顿开玩笑说:「这就是两位副总裁的工作」。 这中间还有一个趣闻,那就是有一次余恺离开辛顿房间的时候,竟然把自己的包忘在了房间里。 根据后来孟繁岐从采访中的了解,辛顿和两位学生声称,“自己知道里面或许有什么资料,也许能告诉他们百度愿意出多高的价格。但是他们知道这么做不对,所以他们没有这么做。” 对此,孟繁岐持怀疑的态度。 要是换了他的话,肯定是很难忍得住诱惑窥探一二的。 说起来,在去年谈判的时候,更为耀眼的是冠名了alex的阿里克斯,毕竟这个网络和算法是开启了深度学习时代大门的钥匙。 但其实后来更为耀眼的是辛顿的另一位学生,openai的首席技术官,伊利亚。 22-23年持续刷屏,革命了上亿人生产方式的gpt系列,都是他直接领导下的产物。 当然了,现在他还不是什么上百亿美金身价的首席技术官,此刻的他也只是辛顿老师旗下,刚刚入职几个月的谷歌研究员罢了,和孟繁岐即将入职的职位基本相同。 要论收入,恐怕还得少上不少,毕竟三人团队出的成果,导师又是成名已久的ai教父,蛋糕要被分掉不少。 辛顿团队当时是被一次性买断收购,总价4400w美元,分到两位学生手上,估计是~1200w左右的一次性收入。 收购性雇佣之后,工资倒也不会开太高。 孟繁岐肯定是不会满足于收购式的收益的,他很清楚自己每次提出的东西都将成为后来的经典范式,只有分成合约才能够满足他的胃口。 清晨时分,天刚蒙蒙地亮起,孟繁岐就已经醒了过来,心中想着这些谈判相关的事情。努力回忆着相关情报的同时,有些紧张地在查询一些专用的英语词汇。 虽然他前世从考研英语,到精读各种ai论文,英语有了很大的进步,口语也还算流利。但要说到商业谈判,正式合同这样非常专业的内容,他还是相当勉强的。 “时间赶得太急,这次确实失算了。”孟繁岐心中暗暗叹气,他本以为自己阅读技术论文毫无阻碍,英文水平应该完全够用了。 直到刚刚醒来无事可做,翻出之前下载下来用作参考的一些商业合同细看的时候,才发觉完全是高估自己了。 “等明年安顿下来之后,真得专门请一位律师一位投资顾问。专业的事情还得专业的人去做才省心。”孟繁岐摇了摇头。 “alienation是转让,prejudice是损害,neglince是过失。”孟繁岐正在焦头烂额地查询这方面生僻词汇的时候,只听见后面幽幽地传来了韩辞的声音。“法律词汇有不少都有特定含义的,你全靠自己查哪里来得及学会。” 孟繁岐回头一看,才发觉后座的韩辞不知道什么时候醒了,此刻站身来,正趴在椅背上看自己在做什么。“你怎么会如此熟悉这种法律英文词汇?” 此刻,发觉原来孟繁岐在诸如这样的领域上其实远远不如自己的韩辞,心情大好。“也算不上多熟悉,距离专业的水平还差得远呢,不过远比你这样临时抱佛脚的三脚猫强多了就是了。” 尚在临阵磨枪的孟繁岐并不知道,此时此刻,谷歌方面的紧张比起他来只多不少。 “白度那边是什么情况。”清晨醒来,杰夫很快就注意到了昨晚白度发布的宣传片。在ai领域,现阶段和谷歌有直接竞争的科技巨头并不算多,因此杰夫非常关注白度,微软和脸书。 稍微观看了一下视频内容,杰夫并没有太在意,与只乎上一些专业网友的看法相同,他觉得白度只是采用了一些不大公正的对比方式罢了。 但早餐时分,阿里克斯的一句话却让他陡然警觉起来,“那个ng的学校好像离白度总部还挺近的。” 第72章 急迫的谈判 “你是说白度的这个结果和我们这两天要见的孟有关?”杰夫心头一紧,他这次来澳大利亚,唯一的任务就是招揽孟繁岐,不会这么巧?“他做出drea和生成式对抗网络才多久,一两个月的时间,哪里够一个不同的领域再有这么好的成果。” 这是一般人的思维惯性,如果一个人刚刚做成了一两件大事,那么通常不会有人觉得他还同时筹备着相同级别的其他事情。 “而且他的生成式对抗网络文章里没有白度的人员共同作为作者,本人的信息描述中也没有提到任何白度的机构。”阿里克斯震惊于drea对自己的惊人超越,因此仔细读过孟繁岐公布的生成式对抗网络的论文。“应该不会和白度有什么关系。” 这篇论文阿里克斯一字一句地仔细品过,了解得非常细致。 “但是如何去解释白度新检测算法的优异性能呢?”辛顿站在一旁,思索了一番,“如果是基于深度学习,目前检测算法无非就是两点,骨干的神经网络和检测头部分的筛选分类。” “这种速度的提升,一定主要来自于检测端的创新,否则是远远不够的。但这个级别的性能飞跃,同时又绝对和作为骨干的神经网络脱不开关系。”辛顿的眼力相当老辣,基本上把yolo算法的提升来源猜了个八九不离十。 “就drea体现出的性能而言,白度绝对和孟脱不开关系。”辛顿的视角更多的是从技术本身分析。“时间上也比较巧合,可能是白度的检测端创新与孟繁岐的骨干突破强强联合了。” 辛顿的想法还是保守了一些,他怎么也没想到,两项惊人的技术突破都出自同一人之手。 “不过,孟在这次竞赛的检测赛道也有相当不俗的成绩。”伊利亚补充道。 ia系列竞赛,最受关注的还是一千多万图片的千分类,检测赛道参赛人数其实要少很多,受到的关注也很少。 比较可惜的是,本届的检测赛事并不比拼速度,所以几人无法借助这个赛道的结果对事情进行进一步的推测。 “他不会被白度给挖走了?”杰夫微微皱眉,心里感觉不大妙。要是真的被抢先签走了,那就麻烦了。 自己去年挖辛顿三人的时候,就差了一点点,险些被白度捷足先登,白度在这方面的动作还是相当之快的。 上回多个科技公司竞价,白度不仅是抢在自己前面第一个联系辛顿的,同时也是跟自己犟到了最后的。 如果不是辛顿三人对谷歌偏爱,最后自己能不能胜过白度,还尚未可知。 难道说,天道好轮回,现在要轮到自己输给有地理优势的白度了? “阿里克斯,我们是约在今天下午的对?”杰夫问道,“他现在到澳大利亚了吗?” “到了,今天早上的飞机。我前两天问过他需不需要我们安排接机,他说不麻烦了,下午见。” “那就好”听到孟繁岐早上已经抵达,杰夫悬起来的心又放下了一些。只要愿意来和自己谈,说明白度还没有得逞。 怕就怕这小子一个本科穷学生,没见过什么世面,直接被白度花个百来万就拐走把合同签了,不给自己出价的机会,那就太憋屈了。 只要让自己开口,杰夫有绝对的信心在谈判桌上把对方拿下。 凭借顶级的薪水预算,宽松的工作环境,还有辛顿这座ai丰碑,杰夫实在想象不到一个本科搞ai的大学生拒绝自己的理由。 孟繁岐一直故意不留下自己的联系方式,这件事本来让杰夫觉得是一件好事。 一个未曾有过发表的无名小卒,在不希望被打扰的情况下,除了曾有邮件往来的阿里克斯,其他公司应当不会获知他的情况。 因此在会面的时间安排上,杰夫没有赶得太急,二十多天的时间,他完全可以等。 “一定是那篇该死的生成式对抗网络论文。”杰夫有些懊恼地说道,这就是地理位置上的问题了。 如果孟繁岐在美国,他当天就可以打个飞的过去,直接拿下,一天都不耽误。 可要跑去燕京,他还是犹豫了一下,觉得对方也不想联系什么公司,心存了一些侥幸的心理。 “等下午见面了谈就好了,杰夫你不用想那么多,想了也没用。”辛顿知道杰夫私下里性格比较外向,不大掩饰自己的情绪。 下午两点钟的这次谈判,地点就约在国际计算机视觉大会的会场里面。 与大家想象中的,大型会议室又或者是私人会所不同,国外ai相关的许多谈判和会谈,其实都是在国际会议的过程当中进行的。 几个业界或者某领域的大牛,三三两两进入小会议室又或者是提供下午茶点的房间,甚至是吸烟室。 就在这么看似草率随意的场景下,便敲定了很多技术和企业的未来格局。 这种方式,实际上也更合孟繁岐的胃口。 2013年12月5日的中午,当结束了上午的会议展程,大家正在边吃边聊,各种吹牛的时候。 已经有眼尖的人发现了杰夫和辛顿一闪而过的身影。 “我没看错?那个是不是辛顿?”有年轻的研究者惊喜地对着同伴说道,“我听说辛顿由于身体原因,基本上美国和加拿大以外地方举办的会议都不怎么参与了,就算是在美国和加拿大,还得看看地点和气候呢,怎么跑到西尼来了?” “他旁边的那个是杰夫,这位大牛参会得就更少了。”杰夫毕竟不是ai领域内的研究者和学者,而是作为谷歌的核心技术人员,参加会议发论文这种事,一般来说还轮不到他亲自出马。 “这是什么风把两尊大神吹到西尼来了?”两人低调的行踪仍旧在会场引起了小规模的骚动和议论。 大多数人保持着礼貌和距离,没有继续过多地关注和讨论。 但有意无意的,都有些关注那个方向,那间不大的会议室。希望知道到底是何方神圣要与这两位巨头直接对话,搞得神神秘秘的。 谷歌大脑的四个人,总不可能专门从美国跑到西尼的会场里来开内部会议? 和目前为数不多的几位读者说几句 可能说得有点乱,就想到哪里写到哪里。 先说说我个人情况,我是电气本,电子硕,ai\/cv博。一路专业换了不少,现在在ai公司打杂,可以说对ai方面的内容理解勉强在网文圈排在前列。 网文看了挺久,最近绘画ai和chatgpt很火,我就突然奇怪,怎么站里没看到有人写过真实点的ai方向题材。 也没多想,注册了个号就开始打字了。 这个内容,尤其是第一章的内容,应该是大多数做ai的人重生的话第一件会做的事情,先把恺明的残差网络给偷了,然后去ia暴打谷歌。 我每天加班很累的时候也会想,回到2013一个残差网络,直接就够吃一辈子老本了,多好。 这个主线可能是带有我对人生的一点真实的期望和幻想,因此我不管是对具体的ai任务,ai技术,具体参数和时间点和实现难度的描写和考虑都是非常慎重的。 基本不超过我自己回去能做到的水平太多。 提到的主要技术,论文我都看过,提到的主要学者,资料我也都查过。 希望尽力还原一个足够真实的ai领域。 可能是为了尽量真实的缘故,系统没加,剧情也挺收着的。 当然了,主要是我自己写得也不行,挺久没动笔了。 我自己也知道这不大符合网文的节奏,因此十五万字了试水推也没来,也属于我意料之中。 不过推荐这东西也就那样,我几年前写过一次小点的频道,一路上过三江,最后也就五六百订。 过于关注那东西反而写作的心态和乐趣都没了。 推荐有没有不重要,我的水平靠写网文想追平我自己的本职收入难度还挺高的,没真的指望这个赚什么钱,知道自己笔力和经验远远不够。 这本书只要还有一个人在跟我互动说想看,我就不可能切,就算以后只剩1个订阅也会写完本。 写到七十六章左右,基本回收开局第一章的内容了。 再往后的内容,我尽量放开点,多加点爽点,不犯文青。 主角往美国一去,尺度也能放开点。 顺便,建了个读者q群 感兴趣的可以加。 给建议也好,聊天吹牛也好,甚至讨论ai技术也可。 第73章 低调登场 当辛顿和杰夫出现在会议的场地当中,参会者们的目光自然而然地会聚焦在他们身上。 作为人工智能领域里的两位重量级人物,名字自带光环,行走之时就像黑洞一样,总能吸引关注和目光。 在这个ai技术肉眼可见地已经开始起飞的特殊时刻,许多人都想跟他们接触,向他们请教一些关于ai方面的问题,又或者是争取合作。 只可惜谷歌一行四人显然暂时没有和大家交流的意思,因此也没有人真的很不识趣地去敲那扇小会议室的门。 稍微过了几分钟,阿里克斯和伊利亚从那间会议室里走了出来。 他们并不会参与到实际的谈判过程当中,来西尼的主要任务其实是照顾和陪伴自己的老师。 顺便,也参加本次顶级会议,四处看看。 因此,谈判时间将近,阿里克斯和伊利亚选择提前离开房间,准备去会场里逛逛,不知道这次有什么新的成果。 相比威名赫赫的辛顿和杰夫,阿里克斯和伊利亚还显得有些稚嫩。众人不敢去打扰两位巨头,但和这两个年轻人套套近乎的胆子却还是有的。 阿里克斯和伊利亚刚刚出来,还没走几步,周围关注到这件事的人就已经三三两两,有先有后地围了过来。 “你们老师和杰夫这么远跑到西尼来,这地方能有什么是美国没有的?” “他们是要见谁吗?我在这好几天了,没看到什么重量级人物是他们不熟的啊。” “谷歌是不是梭哈ai技术了,你们现在在搞什么?深度学习框架?还是计算硬件?”也有人不大关注今天的事件本身,而是更关注技术的。 这时候,突然有一个年轻的东方面孔出现,他远远地看见了阿里克斯,便冲他挥了挥手,随后便往那间会议室的方向去了。 阿里克斯愣了一下,然后恍然,自己现在多少也是网络上能搜到照片的人物了,这个华国人想必就是和自己通过几次邮件的孟繁岐没错了。 一直知道他的年轻,才只是二十出头的本科生,可亲眼所见的时候,还是相当震撼。 自己直到博士快毕业才在去年做出的成果,如此轻松就被眼前这个陌生的年轻人超越。 甚至于他在做这件事的同时,还分出了精力做了一两个同样级别的杰出工作。 虽然没有进行太多互动,但处在众人目光焦点的阿里克斯的反应,瞬间使得在场的诸人都注意到了这个刚刚来到此处的华国年轻人。 众人就这么看着他一步一步地走向了大家都想进却不敢打扰的会议室,然后轻轻敲了敲门,旋即推门而入。 孟繁岐的行为引起了旁观者们一阵骚动。 他直接走进了会议室,这让这群局外人非常震惊,他们知道这是一个不可思议的机会。与辛顿和杰夫对话,讨论人工智能技术的未来。 大家都被这位年轻学生的动作唤起了好奇心,毕竟在满屋子硕博起步的会议场所,他看起来格外的年轻,却有资格直接与两位着名技术大牛对话。 “这到底是怎么回事?” “他究竟何德何能?” “杰夫和辛顿想和他谈论什么?” 面对类似的问题,阿里克斯和伊利亚只是笑着扯开话题,没有透露任何的信息。 推门而入的孟繁岐,见到了两个前世看过无数次照片的人物。 灰白头发的辛顿身着浅色衬衫,外面套着一件黑色针织衫,正对着自己微笑,原本显得阴沉的鹰钩鼻也变得和蔼了不少。 而露着大块额头的杰夫,则是灰色绸缎衬衫的简单打扮,他的长相有一些像前些年在华国颇有些名气的加拿大相声演员,大山。 杰夫的脸型方正,且有些马脸。有些消瘦的他,脸上的肉不多,显得面部棱角分明。 此刻的他正刻意做出一副严肃威严的表情,这让他整个人看起来颇具压迫感。 只可惜,孟繁岐对他稍有了解,私下里其实是挺沙雕幽默的一个人。 正式场合中,尤其是谈判博弈环节,对年轻的职场新人施加压力是杰夫的拿手好戏,去年拜会辛顿的时候,阿里克斯和伊利亚就感受过他的压迫感。 早有准备的孟繁岐,可不会如此轻松地就被拿捏。 在孟繁岐打量两位巨头的同时,这两位联手战斗了接近一年的合作伙伴也快速交换了一下眼神。 在这个至少也是硕博生参与的领域中,他们已经很久没有见过如此年轻的人能够取得世界级的突破了。 孟繁岐真的站在他们面前的时候,这份年轻给了他们意料之外的冲击。 上前握手,相互介绍了一番之后。 “你是一个很爽快的人,也是一个很聪明的人。我们就不绕什么弯子了。”杰夫单刀直入道。 “大部分时候,我相信年轻意味着无比的潜力。但从你的经历和教育背景来看,我也不得不为公司考虑,你这次的成就只是幸运和碰巧的可能性。” “这是一笔天文数字的合同,我们只是在谈论一些可能性,希望你不要有其他的想法。”辛顿补充道。 孟繁岐在心中暗笑,别人或许还不理解这几项工作的含金量,眼前这两人怎么可能会不懂? 无非就是一个在唱红脸,一个在唱黑脸。杰夫黑着脸,给自己施加压力,部分否定自己已有的付出,让自己去承诺之后还会有同级别的学术突破。 正常人在这个时候多多少少都会陷入焦虑和被动,毕竟以后的事情谁能说得准呢。 但孟繁岐,偏偏是这个世界上最不担心自己能不能出技术成果的人。谷歌的施压策略,完全踢在了铁板上。 “不如这样如何,我们可以签下对赌合约。”信任不够的情况下,对赌合约是最好的解决办法,对自己不希望发生的情况施以惩罚避免损失,对自己希望发生的情况则多让渡一些利益。 孟繁岐顺势而为,顺着话头反过来去争取分成合同。 “我们完全可以按照研究成果的质量和数量签订价格,或者按这些成果的采用情况乃至将来带来的额外收益进行分成。如果我的方法不被谷歌采用,或者采用后没有带来收益,我甚至可以不拿一分钱。” “就像我现在和白度的合作方式一样。”孟繁岐说完,还不忘反客为主,抛出一个重磅炸弹。 第74章 天价合约 “白度公布的检测算法是你们合作的技术产出?”辛顿的注意力更多偏向技术方面,一个比较纯粹的学者。 “与其说是合作的技术产出,不如说是我单方面提供的技术服务的。”孟繁岐当时与白度合作,一定程度上也是希望自己在此时的谈判当中可以取得主动。 “单方面的技术服务?”辛顿瞳孔地震,“那检测端的创新?” “检测端做了一个单阶段的直接回归,规避了传统的二阶段区域提出机制,结合了我的骨干网络,速度和性能方面都有了比较显着的提升。” 孟繁岐说着,直接掏出了当时给李彦弘看的同款实验结果表格,以及drea的论文最终版。 这篇论文孟繁岐明天就会公布,这样后天参会的时候他可以省略掉一部分内容。 因此直接拿出来给谷歌的两位先看看也没有什么。 “这个速度看起来稍微合理了一些。”辛顿大概估算了一下模型的参数量和计算量,“非常震撼的想法,真是英雄出少年啊!” 辛顿一生的经历以学校为主,这次来谷歌主要是借助他的名气和威望,起到一个辅助的效果。 看到这些实验结果和论文,辛顿非常满意,喜悦之情溢于言表。 心里盘算着,这小子现在还在读本科,我看看将来有没有什么办法,直接把他拐来我名下读个博士学位。 杰夫在一旁,看着辛顿站在旁边,已经笑得合不拢嘴,心说果然谈判上是指望不了辛顿太多。 虽然与白度的成功合作这件事有很大的议价权,杰夫仍然在为谷歌争取主动。 “但这项技术既然已经和白度合作,想来应该无法交给谷歌?”这是个非常合理的说辞,可他万万没有想到,李彦弘竟然为了交好孟繁岐,这一次特意开出了非常优惠的技术合作合同。 “根据与白度签订的合约,我仍然有权力为自己所加入的公司提供这项技术。不过该公司需要保证两点,不继续对外提供这项技术,以及不涉足华国的检测相关的市场和行业。” 这个情况杰夫完全可以接受,谷歌早已退出了华国市场,双方并不存在太多直接的竞争。 只是他不理解,李彦弘到底是怎么想的,竟然只签订了技术转让合同,而不是出更高价将技术买断。 这里也体现了李彦弘和杰夫两人方法上的不同之处。 李彦弘认为事情的关键还是在于与孟繁岐的关系是否能够相处得好,这次的技术相比之后的发展来说只是九牛一毛。 而杰夫则更倾向于彻底把控已有的技术,就事论事。 “我们最初是看中了你在drea上的创意和想法,因此通过你与阿里克斯曾经的邮件往来联系上了你。可就在这短短的三四周内,你就已经连续两次再创佳绩,并且是在与骨干网络设计完全不相同的领域当中。” 给压力归给压力,对于孟繁岐的成果和能力,杰夫也是相当震撼相当欣赏的。 “如此看来的话,我们上次开出的五百万美金两年签字费,每年薪水总包一百万(~30工资+~60股票+~10奖金)的价格,可能已经过时了?” 杰夫转过头来和辛顿眼神交流了一下,然后试探性地问道,“在这个基础上给你签字费翻倍如何?” “杰夫,你在谈判最开始就跟我说要单刀直入,不绕弯子。怎么现在自己开始步步为营,一点点试探了?”孟繁岐微微皱眉,杰夫这操作可有点双标啊。 “三千万美金三年签字费,你要签至少三年。”杰夫直接改变了风格,仿佛已经亮出了自己的底牌,但实际上他还是给自己留有一部分余地。 从一千万到三千万,听起来是翻了三倍,但同时也从两年变为了三年,因此实际上也只是再翻了一倍罢了。 这种模式的年薪占比很少,大头都在签字费买断的那一下。 孟繁岐思索了一番,两年的时间他比较可以接受,三年就稍微有一些太久了。 自己14年初入职的话,两年到两年半的时间,在16年初左右应该就已经足够结束早期需要狂发论文的时期。 到那时候,孟繁岐计划是依靠自己的学术地位和资本累积,再加上对大势和成功模式的预知和把握,迅速推出和落地一些技术产品。 到那个时候,如果还签在谷歌,少不了会有诸多的不便。 伊利亚15年底之所以要离开谷歌去openai,便是因为在大公司做这些具体的落地项目手续十分繁琐。 即便是谷歌这样的顶级技术公司,也不免会有外行指导内行,管理凌驾于技术之上的情况。 单纯只做研究的时候倒还好,想要牵涉其他公司,投入生产部署,也不是一件容易的事情。 “我可以签三年,但我希望是分成合约,如果是分成合约,我可以完全不要签字费。”孟繁岐仍旧坚持自己的合约模式,一次买断的操作对自己来说实在太亏了。 “你加入谷歌之后,免不了会有技术上的合作者,还有多部门的协作,分成的模式,具体贡献如何划分,我们还需要再仔细商议确认一下具体的条款。” 杰夫也不排斥这种模式,毕竟分成可以约定净利润的比例,他真的分得多,对公司来说并不是坏事。 只不过此时此刻,他们的确没有料到这个没什么社会经验的本科生竟然直接了当地拒绝了己方开出的千万美元两年的合约,以及后面加码的三千万美元三年的合约。 这完全出乎了两人的意料,他们没有准备好特别完善的分成方案。 对于孟繁岐提出的要求,杰夫也需要和其他高层稍微商定一下。这个比例一个搞不好就容易给出去太多。 要知道去年辛顿三人听到4400万美元的时候,腿都有点软,脚步都有些飘了。 杰夫这次过来,其实最真实的底线是五千万美金四年,也就是年均1250万美元的签字费。 但目前看来,似乎纯粹的签字费并不能满足这个年轻人的胃口。 “这个倒不要紧,我们可以明天,或者后天iag研讨会后再一起谈一下分成模式的具体条款。” 孟繁岐根本不着急今天非要确定合同不可。 白度那边的重头戏,技术的发布会还在后头呢。 等到那边的细节公布出来,合作的具体情况出来,自己可以操作的空间只会越来越大。 第75章 捡到宝了 这种谈判一次无法走完整个流程是很正常的事情,饶是像李彦弘那样目的明确的拜访,口头协议之后也再仔细核对了一次合同的内容。 谷歌方面准备在一到两天的时间内,草拟一份分成合约,动作已经很快了。 总体的意向基本上算是达成了,就加入谷歌这件事,还是双向奔赴的。 孟繁岐需要借助谷歌即将开发出来的深度学习框架tenrflow(tf),目前的代码实现方式实在太过不便。 谷歌海量的计算资源,和后来的张量计算单位集群,也是孟繁岐以后想要实现种种创举必不可少的工具。 成千上万个计算单元,不管是英伟达的gpu还是谷歌的tpu,总是在大厂里薅羊毛比较舒服。 如果自己构建集群,不说几个亿的成本先进去,光是支撑这些设备持续运行的损耗他就很难负担得起。 所以这点上,孟繁岐必然是要加入谷歌的。谷歌也接受了分成的方式,只是具体分成怎么分法,谷歌方面需要慎重评估一下。 既然入职的大方向已经决定,剩余的时间,自然就有一些吹牛画饼的环节。 千万不能小看这部分,尤其是合同正式签署前。大饼花得好,预算砍到脚。 真给你忽悠瘸了,上点价值和情怀,低预算将人拿下也是非常有可能的事情。 “我加入谷歌已经差不多十五年了,在这家公司见证了互联网的崛起,而现在我认为我正在引领着人工智能的崛起。” 现在这算是谈完正事之后,讨论过去和未来愿景的环节,杰夫希望介绍一下自己和谷歌对ai未来的一些计划和蓝图。 “帮助计算机识别物体,理解语言语音,甚至进行对话,这些以前看来根本是天方夜谭的事情,如今逐渐成为现实。” “就单单拿计算机视觉这一个方向来说,就在过去的五到十年里,计算机就快速地发展出了[看]的能力,并且,就你最新的成果来看,已经飞速来到了人类水平。” ai时代的技术发展实在太快,这是杰夫愿意下血本招揽人才的核心原因。 “谷歌现在有许多希望发展ai技术的场景,我们要实现一百多种语言的相互翻译,以便人们更好的交流;我们要智能分析医疗图像,更精准地预测和诊断疾病。这些所有的应用当中,其实最核心的就是两件事情,算法和算力。” 杰夫的总结非常精要,现代的ai主要基于神经网络这个老古董算法,如果抛开计算能力去谈论ai算法,完全是空中楼阁。 “谷歌有决心打造世界上最强力的算力平台,我们一定会让优秀智慧的算法最大程度上发挥它们的价值。” 对于杰夫的这个决心,孟繁岐并不怀疑,这正是他初期选择谷歌的原因。 “算力的含义比较纯粹,也好理解。但算法的含义太多,其实我个人倒是觉得,网络结构本身的设计不是什么重点和核心的东西。 真正想要改变世界,需要足够简单易用的框架和平台,要易于部署,在运算的数据类型上做优化加速。” 这个阶段,业界非常关注神经网络的设计,具体哪一层怎么设计,用什么操作比较好。 这个时期,这么做起到的收益也十分巨大,比如去年的ale和今年的drea,都有很恐怖的提升。 不过在孟繁岐看来,ai时代后期的结构就不怎么变化了,最重要的还是大力出奇迹,加上他很清楚什么任务用什么结构比较好,结构设计对他来说太过简单。 “当竞争走到最后,大模型的训练技术,和海量优质资源更为关键一些。” 杰夫和辛顿偷偷交换了一下眼神,感觉怪怪的。 本来是杰夫来给这个还在学校里接触研究的本科生展现一下谷歌的野望,什么多领域开花,最大的计算平台之类的。 怎么感觉这小子对ai工业的主要痛点问题了解的如此清楚,不像是象牙塔里搞研究的样子。 学界研究ai,主要是为了验证某个猜想,提升具体的指标。 工业ai则更加务实一点,怎么实现需要的资源少,怎么做模型的速度更快,怎么样才能部署到不同的设备上。 两边经常彼此看不惯,学界觉得工业界就是干脏活累活的打工仔,没什么创新突破。工业界则觉得学界就会写论文吹牛,做出来的东西大家根本用不到。 杰夫和辛顿可以说是工业界和学界的代表人物了,杰夫就连读书的时候,所写的毕业论文都是工业方向的,大型神经网络的并行训练。 那时候才1990年,杰夫已经开始研究2023年最为核心的技术,大模型的训练方法。 “我不得不说,我本以为连续做出算法方面突破的你会是一个偏学界风格的人。”杰夫表情诧异中带着惊喜,“没想到你看待问题的思维和我们工业界的需求非常符合。” 杰夫接触过的出色学者很多,甚至就连辛顿都带有学界的思维惯性,因此在谷歌大脑内部,辛顿并不参与任何管理和决策工作,只专心负责学术研究。 或许这一次,我招聘的并不仅仅是一个出色的算法研究员,他可能在公司的ai战略上也能够给我不小的帮助。 杰夫隐隐约约有这种预感。 他之前的十几年是谷歌的技术骨干,参与的管理项目并不多。但ai这个方向,是他大力支持吴恩达推动的,因此这方面的许多事情都由他来领导。 作为一个领导者,杰夫喜欢不一样的观点,喜欢新鲜的事物。 比如神经网络和ai,虽然90年时期他也曾钻研过,但之后他在谷歌的工作更多的是架构,搜索,广告方面。 其实并没有再更新过任何ai知识。 直到2011年,吴恩达与谷歌合作项目,他向杰夫建议道,情况在飞速改变,谷歌应当重视ai技术。 杰夫很迅速就拥抱了这个变化,甚至可以说,他天生就对这种自己不够熟悉的潜力方案感兴趣。 一旦被他搞懂了问题的解决办法,他反而会失去兴趣。 孟繁岐在ai战略的想法与自己不同,杰夫反而更加欣喜,心中暗道,这回真的是捡到宝了。 第76章 你这饼画得比我还大 感觉到孟繁岐的独到见解,杰夫也分享了谷歌一些ai目前内部的理念和目标: 第一,积极用ai解决各类问题,包括翻译,地图,语言,图像等等,把ai尽力容纳进目前既有的谷歌产品和服务中,利用ai技术提升产品的能力和用户体验。 第二,不断推出各种ai软件和相关工具,让ai技术易用易得,持续分享最新研究成果,不断以论文公之于众,开源代码。让更多研究者受益,让开发者们利用谷歌打造的ai工具,更好地进行自己的机器学习模型的开发。 第三,利用ai解决全世界面临的大问题,医疗、能源、环境保护等等,与其他组织合作,共同解决挑战。 由于目前ai能够真的落地到工业的内容还不多,所以杰夫的这几块饼和这几条路线,有点假大空的嫌疑。 孟繁岐听完之后,直接反手开始给杰夫画饼,而且画得更真实,更具体。 “我计划要迅速推出ai模型和技术解决各类实际问题,长期目标是用一个万能的通用方式去解决。比如语言类,什么翻译,问答,分类,生成,一个模型给他全搞定。 不仅语言模型要搞万用模型,视觉语音模型也要做一个究极巨无霸,直接把什么分类检测分割生成给他四合一了。 先掀起视觉风暴,革命图像任务,然后统一语言模型的范式,再融入多模态,语言图片和声音直接融合。” 孟繁岐侃侃而谈,把这时间段还在思索骨干神经网络怎么设计会更好一些的辛顿和第一次领导这么大部分的杰夫吹得一愣一愣的。 杰夫听得人都晕了,好家伙,你这个饼画得比我大多了啊?小东西吹得有模有样的。 过几天回硅谷了,我特么就按这个节奏跟谷歌的ceo吹! 一年革命机器视觉,两年统一语言范式,三年多模态融合,第四年直接一个大模型一统江湖了。 是不是第五年直接满级自动驾驶,第六年完全智慧机器人,第七年,2020就造出终结者了? 十周年直接虚拟入侵外星飞船了。 杰夫怎么也没有想到,孟繁岐还真没在画饼。 虽然时间上稍微吹了点牛,夸张了一些。比如chatgpt这个级别的千亿参数大模型,没有英伟达的a100会比较难去训练。 卡如果不够好不够先进,分布式所需要的卡数量就越多。卡的数量越多就越有可能出现硬件上的问题,一旦有几卡出现错误,整个流程可能都会受到影响。 按英伟达的发售时间来看,想要出chatgpt这个水准的对话机器人,很可能受到硬件的限制,需要2020年底才能出来,最多只能提前两年左右。 但为了再次提前推出这系列技术,孟繁岐也可以考虑稍微牺牲一部分chatgpt的性能,借此将chatgpt的出现时间往前再提一两年。 从现在开始算起,四年可能还是吹了点牛,五六年希望还是很大的。 不过杰夫倒也是个实诚人,他心知肚明,自己有画饼的嫌疑。 谷歌大脑团队的地位最初并不高,虽然吴恩达创立该项目,证明了深度学习的潜力,但在相当长的一段时间内,该团队并没有什么产出。 不少谷歌高层人士都认为这是在浪费钱,对团队的方向持怀疑和负面的态度。 2012年辛顿团队的突破性成果,以及年初辛顿团队的加入,很大程度上缓解了这方面的问题,众人对这位ai老教父还是持有极大的尊重的。 不过,虽然研究上有辛顿把关,效率和质量都提升了不少。 技术落地这件大事始终没有一个阶段性的成果,没有什么实际的项目真的运用了新技术。 这次吸纳孟繁岐,除了再次借助他的惊人成果提高谷歌大脑的团队地位之余,杰夫对刚才实时检测算法的情况非常感兴趣。 这很有可能是一个大规模的技术应用,可以彻底一扫谷歌大脑团队一直只在小打小闹的颓势。 “实时检测算法这件事,想必白度的李总已经将各方面的情况总结的非常详细了。”发现杰夫也在打这件事的主意之后,孟繁岐哈哈大笑,自己精心挑选的现阶段变现部署最快的技术,果然颇具吸引力。 “李总的ppt和技术发布会,想必做得非常周密,他的展示要比我嘴巴直接说要详细太多,我们周五看白度的技术发布会就好。” 开什么玩笑,分成的合同还没见着呢,就想我掏技术出来?孟繁岐不动声色,打起了太极拳。 虽然由于需要谷歌的框架和tpu,早期签谷歌已成定局,不过签合同前就聊技术细节是不可能的。 如果谷歌的分成约定最后真的很不理想,孟繁岐完全可以不将很多技术内容交出去,这种纯技术和想法的东西,即便有合约规定,想要绕过限制通过朋友发表,也没有那么困难。 这边的谷歌刚刚对实时检测算法动了心,提前出击,和孟繁岐达成技术合作的白度则已经和多家龙头企业谈到比较理想的阶段了,进展非常神速。 由于这次的服务内容技术性很强,客户的实际需求彼此之间有许多不同,往往需要去客户那边根据要求现场操作、调试和演示,白度的大多数员工短时间内并不能够胜任该工作。 而是白度深度学习研究院,这个本来是研究所性质的部分全员出动,研究员直接变销售+客服了。这也是国内大厂急于技术变现的一个缩影。 截止目前,阿狸系和企鹅系没有特别专门的需求,但他们开始意识到ai技术的重要性,因此希望有技术交流,两边已经谈到了第三阶段。 而几家大型的制造业和煤炭金属行业,则还需要再提供一些数据,做一些模型训练的工作。不过目前谈判情况相当不错,两边的期待都很高。 最最重头的,是政府的道路监控和安防相关的需求。这部分的单如果拿下,那可就不得了了。 政府订单稳定持久,一般不大会频繁更换,尤其这个方面的订单量远比企业大,需求通常都比企业低。就是手续和各方面琐事可能会多一些,不过完全可以接受。 和政府相关部分负责对接的,是余恺副院长亲自带队的一批精英人选。 其中自然也就包括曾经和孟繁岐直接对接,多次联络请教技术的王恺。 此刻,他正坐在公安局里,左顾右盼。 第77章 王恺在行动 政府现阶段提出的,对实时检测技术的需求主要是两点,道路监控和安防方面。 道路监控这边是最方便的,不管是高速路,高架,重要街道口,政府早就已经部署了数不胜数的道路摄像头。 这个需求的场景非常固定,摄像头是不会动的,拍摄的角度也不变化,只是画面中一直车来车往,有时候可能会有行人或者非机动车辆出现。 像高速路,高架路上就更简单了,来往的除了车基本上啥也没有,非常的好做。 不过,政府在这些图像上的需求却有所不同。 孟繁岐提供的基础技术,是在图片中框选出一些物体,并标注它们是什么。 可政府在道路检测上的重点需求并不是这个,我特么视频里全是车,还用你给我标注这些都是车? 你给我标出来干嘛呢,我拍的时候就知道了,这些路上一直都是车来车往。 所以虽然政府方面目前的意向十分积极,很看好白度,但是白度却非常焦虑,忙得是焦头烂额,李彦弘和余恺这几天都没怎么好好睡觉。 这是一个巨大的机遇,也是一个巨大的挑战。 如果能够短时间内完成需求,全国那么多的道路监控摄像头,这得是多大的订单啊? 当然,李彦弘也很熟悉,这里面肯定会有逐个试点,慢慢推进的过程。但他有信心,只要第一单顺利,后面的推进一定是势如破竹。 因为这种东西的现代化智能化,会是一个不小的政绩,李彦弘很清楚政府方面负责人最大的动力是什么。 政绩+白度方面的辅佐宣传,李彦弘想不出对方不积极推进的理由。 但说一千道一万,现在有一个最大的难题,那就是百度这边不知道该怎么去做。 他们才刚刚接手孟繁岐的代码,虽然消化了大概做法,但对不少地方为什么要这么做,用其他的做法有何优劣,还缺乏深入的理解。 如果让孟繁岐了解到政府在道路检测方面的需求,他还是相当熟悉的,核心点就是超速检测和违章检测。 其中超速检测呢是主要需求,说白就是通过对比视频中不同帧之间车辆位置的变化,直接计算其实时的车速。 由于摄像头角度固定,帧之间的间隔也是固定,所以只要从位置变化中计算出车辆行驶的距离,就可以计算车速了。 但这里有一个难点,那就是你怎么知道不同图片中哪些车辆是同一辆呢?这里就涉及到物体追踪技术。 政府方面并不清楚其中的技术区别和难点,他们觉得你这个检测还挺智能的,我就测一下车速,没啥问题。 对白度其实是过分乐观了,现在的白度根本做不到在孟繁岐的代码上增加这些功能。 另一方面,违章检测只是一个添头,不是核心需求。 违章检测无非就是再添加一些对违反交通规则行为的检测,比如有没有系安全带之类的。 对于大部分的摄像头来说,没这个能力。都离得那么远,又挂得那么高,安全带都拍不清楚。这方面等到以后设备升级,才会真的需要,目前不用过多关注。 道路检测不好做,这个有领导在头疼,像王恺这样的打工仔,主要负责去推进安防相关的一些场景。 这部分的不少功能,目前孟繁岐给出的版本就已经可以兼顾,有的也只需稍作调整就可以做到。 比如对特定区域的监控,提示是否有人。 虽然有监控,但安保人员毕竟不可能一直盯着屏幕看,许多重要机构,摄像头几十个,就是有心想看也看不过来。 你指望收入待遇都普通的安保人员每天不要命地盯监控吗?别白日做梦了。 如果加入实时检测技术,就可以极大地减轻这方面的负担,王恺此行便是要推销这个功能。 不过,他已经在燕京常平分局坐了好一阵子了,却迟迟没有人理他。 只是最初有一位警察拿了个纸杯给他倒了一杯水,之后便再无消息。 王恺本身的耐心没有那么好,但脾气这种事情也得分场合不是,在局里,王恺也没有那个胆子说什么要求什么。 硬是等了一个多小时,还是没人理他,王恺实在是憋不住了。 这次来拜访也是提前和他们领导有预约的,又不是上门卖保险。 忍不住往里走,发现公安警察们三两个一组,都在盯着显示器中的监控视频看,旁边更有几位躺在一旁行军床上的,一看就是累坏了,此刻正在休息。 “田局长,这是什么情况?” 白度总部虽然地处hd区,但是距离常平区也很近。以白度为首的科技园发展,对常平区的益处也不小,尤其带动了就业。 一般大城市,公安分局局长很可能同时兼任区委常委,因此此时的常平公安局长,区委常委田云胜还是非常支持白度工作的。 “啊,小王啊。”田云胜是一个脸型偏圆,有点富态的中年人,戴着一副半框细边眼镜。“我们这里出了点要紧的事情,忘了跟你们取消这次会面了。” 虽说是燕京,但常平区辖区内不少地方还是比较偏远的,偏僻的地方偶发一些案件,解决的难度颇高。 但本次的案件竟然是在学校内,因此迅速引发了民众关注和讨论,事件的影响极其恶劣。 常平区新东方外国语学校虽然靠近六环,但周边还是有许多高校和公司的,隔壁就是燕京信息科技大学和燕京师范,燕京航空航天 “根据受害者朋友们和老师们的介绍,今年学校九月份的新生欢迎晚会,担任晚会主持人的小姚引起了王某的注意。晚会结束后,王某就向同学要走了小姚的微信,并加为好友。之后,二人偶有聊天,但联系并不紧密。次月,王某向小姚表达了爱意,但后者以学习为由拒绝。” 旁边有警察稍微为王恺介绍了一下事情的背景 “没想到求爱不成的王某,竟然会做出如此卑鄙的事情。” 第78章 助力破案 “就在昨天晚上九点多钟左右,王某在常平区某外语学校教学楼六楼东侧教室内,强行与当时16岁的被害人小姚发生性关系,后因害怕小姚告发,遂扼压小姚颈部致其机械性窒息死亡,并将小姚手机拿走。” 这便是常平区公安局目前不少人都在投入的重大刑事案件。 今天的凌晨时分,小姚的妈妈接到了来自学校老师的电话,说查寝的时候发现小姚和男朋友出去住了,人不在寝室里。 这件事情学校要严肃处罚,所以致电与家长协商。 小姚的母亲一开始十分的愤怒,但很快开始感觉到不安。 一是因为自己始终打不通女儿的电话,二是开始感觉到不对劲,自己的女儿一心想要出国留学,平时都以学业为重。 更是远离家乡去住宿学校学习英语,她怎么可能这时候有闲心去谈朋友呢? 自己晚饭时分还在跟女儿聊天,不过聊到一半女儿便不再回复。 心中的不安越发剧烈,小姚的母亲李某决定连夜驱车从老家出发赶往燕京。 路程当中,李某一直尝试联系学校,希望他们可以帮忙找到小姚。 但很可惜,最终在今天早晨回复给李某的却是她女儿的死讯。 小姚的尸体被发现的时间是周四早晨6点多,位置在新东方教学楼601教室。 最先发现小姚的是其同学刘某,刘某表示,当时小姚头向北脚朝南,头部盖着学校的校服。 此后相继有4名学生来到601教室门口,大家最初都以为她在睡觉,还让后面来的人小声一点,不要吵醒她。 他们不知道当时的小姚已永远不可能再醒过来。 作案的王某是普通学生,出手行凶也并非谋划已久,案发之后,全校学生只有王某不见了踪影,所以很快就被警方锁定为头号嫌疑人。 “已经有不少同学提供了证词和证据,王某在过去几个月内,一直反复纠缠小姚。昨晚的监控录像当中,我们也已经找到了足够的证据。” 截止到王恺在外面等待的这段时间,警方已经人证物证俱在,就差抓捕了。 “这不是什么很难的案件,从破获难度上看,属于很容易的那一档。”田局长接过话头道,“案发十几个小时内就报警,我们很快就有了足够的证据,锁定了头号嫌疑人,抓捕凶手只是时间问题。” “我们行动得越快,凶手能逃离的距离就越短,我们需要排查的东西就越少,所以今天恐怕是不方便交流你们的新技术了。”田局长说话直接已经有了送客的意思。 “我们现在的任务就是以学校为中心,通过实地走访排查和监控视频排查两种方式去找到王某的踪迹,然后在最短的时间内将他捉拿归案。” 田局长对本次案件相当重视,在校园中学生和老师平时上课办公的地方行凶,这和在荒郊野岭行凶的影响程度是天差地别的。 最重要的事情是,会让民众有不安全感,所以一定要以最短的时间抓获凶手,方能平息舆论。 当然了,另一方面,田局长还有两年就到了换届的时间,他还指望着自己能在15年去市公安总局呢。 目前舆论已经开始迅速发酵,这件事情怎么着他也得给办好。 至于什么新技术之类的东西,虽然是政绩,但也等等再说。 “田局长,我们需要排查的监控视频多吗?”王恺此刻早已忘记了方才一直等待的不愉快,他隐约觉得这可能是一个很好的机会。 虽然白度现在没有能力在孟繁岐技术的基础上增加目标追踪的功能,就更别提做到政府需求的多目标车辆追踪了。 但在孟繁岐的代码上,加一个出现了指定类型(比如人类)目标就提出警示的功能,那还是很容易的。 比如只要图片中检测出了人类,就对该帧做一些亮度上的变化。 几十个监控屏幕,平时都是暗的,检测出了人就会亮起来,可以极大地节约人力。 在安防方面更是如此,如果出了类似这种性质的刑事案件,警方往往需要彻底排查周边摄像头,并且时间经常极其紧迫。 由于破案的时间紧迫,压力大,事件性质恶劣,在排查监控的时候往往不方便频繁地快进和跳跃。 如果漏掉转瞬即逝地线索,那可是大罪过。 王恺想要直接应用孟繁岐的实时检测技术,协助排查本次案件。 “从案发时间开始到现在,每一个摄像头都有大约十五个小时左右的内容需要排查,目前来看,与案件有关的监控录像,需要排查的至少到达接近百个,如果运气差的话,还需要更多。” 田局长也有些头疼,即便是三倍速去排查,一个人五个小时也只能排查清楚一个部分的监控录像。 可能需要二三十个人一整天的时间,才能彻底把这些内容都排查一遍。 当然,这是运气最差的情况,一旦找到嫌疑人的踪迹,那么需要排查的时间点和地点就可以确定,余下的工作量就可以成倍减少。 只是往往不会那么好运,经常排查掉百分之五六十的监控录像,才会初步发现嫌疑人踪迹。 如果按一半去算,也得是二三十个人排查到今天深夜,才能初步发现嫌疑人。 “田局长,我们的技术可以在这个效率上极大地加快你们的排查效率。”听完田局长的话,王恺觉得这是绝佳的机会。 人只能低倍数去看录像,但机器不同。只要运算速度够快,机器可以以百倍千倍的速度去观察录像,而不会错失任何一帧。 现在白度加速版本的轻量化yolo实时检测算法,可以在较低分辨率或者单通道的视频上实现300多fps的检测速度。 而监控录像的帧数往往只有20-30,也就是说,单显卡就可以实现十倍速观看。 并且,白度的显卡可不止是二三十个。 为了给政府方面一个良好的印象,白度抽出一千张显卡来做这件事还是轻轻松松的。 将每个视频拆解为十份,每份不到两个小时,单卡去解析,只要十多分钟就可以把所有有人出现的片段标注出来。 原本可能需要全队人从中午排查到凌晨的结果,十几分钟就能得出。 加上移动数据,微调代码,测试的时间,最多也不会超过一个半小时。 凌晨时间点,视频里有人闪过的片段不会多。 警方根据这些重点片段再去排查,所需的精力不到原本的百分之一。 第79章 光速抓捕 “只要一个小时,就能排查完所有监控?”田局长声音都拔高了两个八度。 他瞬间心动了,一个小时锁定大概位置,如果犯人没有第一时间直接往外省流窜,而是藏匿在常平附近的话,再有一个小时就能够直接抓捕归案了。 他原本最好的打算,也是48小时内将犯人捉拿,如果能缩短在几个小时内,这件事就是天神下凡一样的刑事创举。 当天清晨接到报案,上午获取人证物证确定头号嫌疑人,中午直接给他一个逮捕,回到局里午饭都是热的。 古有温酒斩华雄,现有我田云胜温饭抓犯人。 这种情况下,一般来说,直接将这种监控证据提供给第三方是不大合适的。 但事急从权,田云胜也不多啰嗦多盘问,直接让王恺把视频文件拷走了一份。 虽然同意白度方面提供协助,可有任何结果之前,田局长可不会停滞手头在做的任何工作,警察们仍旧在做自己的事情。 王恺飞速赶回了白度深度学习研究院,并将这个大硬盘链上了白度的服务器。 李彦弘听闻此事,喜出望外,对王恺的临场反应大加赞扬。 当即抽出一组开发人员,让他们负责这些视频的分割和存放。 王恺则专注于算法功能的修改和测试。 为了最快得出结果,王恺采用了一个最为愚蠢的办法,那就是每当算法在视频中检测出人类这一目标的时候,就记录视频文件名称和当时的视频播放描述到一个文本文档里面。 这样是需要修改最少的办法,到时候,公安民警们只需要按照文件里描述的时间点去查看录像即可。 王恺大概测试了一个视频不同时间点的片段,并做了一些对比,发觉案发后到凌晨八九点的这十二个小时内,基本都是无人的。 十个小时的监控,能有五六分钟的时长有人出现就不错了,这部分可以节约警方一百倍的时间。 而八九点之后,人开始多了起来,不过此时距离案发时间已经12小时,已经不是需要重点观察的时间段。 大概率,会从前面凌晨部分的监控录像中,找出嫌疑人的踪迹,然后定点排查。 加上来回的车程,王恺花了大约两个多小时,在他重新回到燕京常平公安分局之前,他已经通过邮箱发送了自己记录的重要时间点。 “好!好!好!”田局长大喜过望,一连说了三个好,随即迅速将这些关键点信息传达给了众人。 获取了明确时间点信息的诸位干警们,筛查的效率几十倍的提升,王恺回来后没到三十分钟,就有人发现了嫌疑人的踪迹。 而如果不借助这部分信息,众人按之前的速度估算,至少还需要六七个小时才能排查到这里。 “看到没有,这里,他有意识地在躲避监控摄像头,所以我们在校园内的监控中一直没有找到他。”一位警察指着屏幕的角落说道,“凶手虽然是未成年的学生,但具备一定的反侦察意识。” “不过这大晚上,黑漆漆的,想完全躲避密集的摄像头,怎么可能呢?”有经验的警察嗤笑道,“他为了躲避学校方面的摄像头,恐怕像这样翻墙了不止一两次,但还是被周边街道的摄像头给拍到了。” “所有人可以停下手头的排查工作了,以22点02分为起始时间点,王某被拍摄到的翻墙地点为中心,展开第二轮排查!” 这种大规模排查,有了第一个线索踪迹之后,后面的工作会轻松很多,也快很多。 更别提,王恺这边还提供了各个视频有人出现的位置。 警方很容易就可以根据时间和相对距离,去选择应当优先排查的点位。 “他翻出去之后没有连夜逃走,而是找了一家不正规的旅馆先住了下来。”一路追查王某的踪迹,警方很快定位到了王某的第一个落脚点。 这种小旅店不要身份证也给住,是躲避筛查的一种手段。 “他想跑也没法跑,他未满十八周岁,无法考取驾照。靠公共交通的话,一定会暴露在我们的监控之下。” 没有自己的车辆,不管是机场,高铁,火车站还是长途车站,都很容易被发现踪迹。 从他在校园中行凶的那一刻起,就已经注定难逃法网了。 只是恰巧碰到王恺来推销孟繁岐的新技术,被捕得更快了一些罢了。 倘若是孟繁岐在这里,他应当依稀对这个案子有些印象。 因为燕京常平的这几所大学相互之间距离都不远,发生这么恶性的事件,在附近大学生的圈子里都会广为流传。 在原本的时间线上,凶手王某最终在次日自首,王某经过了好一番思想斗争,最终和父母坦白了事实。 在父母的劝导和指点之下,他在第二天傍晚前去自首,当时距离案发还不到24小时。 只可惜那是原本的时间线,排查速度升级的常平警方直接在下午两三点就将其抓捕。 此时的王某还没有做好心理准备,甚至未能来得及与父母通话,原本时间线的自首如今自然也就变成了被光速逮捕,不再有自首情节。 当几位警察铐住王某,将他带上警车的时候还不到下午三点半,距离正式报案时间还不到6小时。 距离案发时间,才大约18个小时。 在各类案件的破获时间记录当中,6个小时已经是非常迅捷的速度了,更何况是命案。 一般来说,这类极短时间内破获的案件,大都是小偷小摸,嫌疑人很多可能都没有留意摄像头,偷完东西就回家了,因此被迅速顺藤摸瓜。 在命案的破获情况中,基本上可以在24小时内抓捕归案的,就值得作为正面典型,大书特书了。 周五白度发布会的前夕,一场突如其来的意外,一次光速的命案破获,让孟繁岐提出的技术有了实际的应用案例。 并且争取到了燕京常平区的好感和支持。 而澳大利亚这边,刚刚与谷歌四人组共进了晚餐的孟繁岐走出餐厅的大门,就接到了王恺发来的微信消息。 第80章 纯净删减内容积极向上版 助力破获常平区的这次命案,算得上是一个出乎所有人意料的因素。 即便是对此事其实大概了解的孟繁岐,重生之后也早就忘记了这么一回事,更没有想到它会在这个时间点和自己扯上关系。 看完王恺给自己发的情况,孟繁岐很快回忆起了这件事的大概脉络。 该案件发生在他的学校周边,后来又因为诸多原因,吸引了不少关注。 孟繁岐依稀记得,有几个关键的节点让此事被更多的人关注到了。 一是凶手的态度,当时好像是凶手的母亲直接跑去联系了被害者父母,希望可以用钱摆平此事。 这种趾高气扬的做法,自然无法得到刚刚遭受丧女之痛的父母亲原谅。 遭到被害者母亲的坚决拒绝之后,凶手一家再无任何反应,没有表达过任何歉意,两边也再也没有过任何的交流。 凶手犯下这样恶劣的罪行,却仍旧以如此高傲的态度对待受害者一家,在这个情况被爆出之后,引起了一定的舆论热议。 迫于压力,凶手的母亲写了一封道歉信,在庭审的时候由律师代为阅读。 连本人都不曾露面,这样的道歉自然没有什么诚意可言,也没有被受害者一方接受。 其二则是凶手家庭的为了减刑的一系列操作。 凶手王某出生在一个富裕的生意家庭,具体情况孟繁岐也没有仔细了解过。 不过犯案后的那段时间,可以明显感觉到对方家庭的手段颇多,招式频出。 首先是案发的新东方英语学校为凶手开具了证明,证明凶手王某“成绩优异”。 这在当时引发了常平地区很多学生的不满和抗议,认为这是学校方面昧着良心的举动。 其次,当时在网络上涌现出了相当多水军,专门意有所指地抹黑受害者,罔顾事实。 原本时间线上,凶手本人在自首前与父母进行了详细的沟通,他的父母在金钱收买受害者家属不成之后,便直接展开了后来饭圈非常常见的舆论抹黑攻势。 通过侮辱受害者,毁坏死者声誉的办法,希望争取减刑。 其主要目的就是希望将王某强迫小姚的这一行为,故意扭曲为两厢情愿。同时,也将故意杀人的罪行篡改为过失杀人。 可以说,王某一家的努力策略就是将恶意转化为过失,只承认过失杀人,对其余罪行尽其所能淡化处理。 由于凶手当时仍为未成年人,在这种策略下,未成年+过失双重加持,以后再减减刑,很可能十几二十年就能出来。 孟繁岐记忆最深刻的事情就是小姚母亲李某的寻求公正之路。 她为了尽快得到公正的裁决,证明王某的罪行,放弃了家乡的事业和工作,滞留燕京,并频繁在全国各地奔波,只求知名律师,权威专家可以介入此案。 这种绝望而没有回应的日子,一直持续了一年多,该案件进入检查阶段的时候才有了比较明显的进展。 后来类似的情况还有江歌案件。 不过,孟繁岐从王恺那里得知,由于自己的算法提升了警方排查效率许多倍,王某直接在下午被捕,未能如他记忆中一般自首。 这件事还是大快人心的。 少了自首情节,王某的减刑会面临相当大的阻力,凶手一方可以操作的空间也小了很多很多。 孟繁岐微微叹了口气,即便事先知道这件事,但第二次听闻的时候仍旧有些感叹。“生命其实远比我们想象得要脆弱许多。” “像这样的人,我猜都能猜到他家里的情况。父母有几个臭钱,平时不管不教,一群狗腿子抓着他舔,真当自己是个什么东西了。”唐璜看完常平学生转发的那些情况,忍不住啐道。 只是骂归骂,一切却都太迟了。 “一旦涉及刑事,事情就实在太过复杂了。”韩辞也叹息道。 像类似这样的情况,凶手家庭比较熟悉法律,又有许多资源愿意投入,不择手段的。 整个调查取证判罚的过程通常都比较漫长,并且一审结束之后,大都又会不服上诉。 来来回回折腾,至少也得要两三年的时间,这可不是谁都能承担得起的。 有多少家庭,停工周就会吃不上饭。 “这一世的结果已经比上一世要稍好一些了。”孟繁岐在心中如此想到,至少自己的算法助力了常平警方在凶手和父母联络并自首之前就将其抓捕归案。 加上李彦弘明天的发布会上,少不了要提到这件事情。 这是他宣传自己技术产品的最好佐证,同时带来的巨大关注,也能够极大程度上限制凶手一方操作的空间。 只是这种所谓的稍好一些,在小姚一家惨痛的遭遇面前,又显得是那么的讽刺。 “等过两年投资有了收益,我就在国内专门成立一个法律援助的基金会。”孟繁岐如此想到,也不做别的事情,不搞什么虚伪的慈善。 专门援助那些因为现实和经济原因,承担不起相关费用,不得不放弃正义的人。 孟繁岐相信国家的相关规定是非常好的,只是华国地大物博,总有条文无法完全覆盖,或者出乎人意料之外的情况发生。 而为这些人提供力所能及的帮助,则是每一位华国人的义务和社会责任。 孟繁岐前世也曾因为劳动合同和奖金问题曾与大厂有过一次劳动纠纷,饶是这种劳动官司,就已经相当耗费普通人的精力了。 对方有专业的团队来跟你打太极,有时候甚至一开始就知道自己会败诉,单纯就是为了折磨你,耗费你的心力,让你最终拿到赔偿也不痛快。 这种地位的差距,导致两边所需要付出的代价根本不对等。 可想而知,刑事案件,尤其是对受害者家庭精神上有极大负担的案件,又该有多么难熬。 “未成年人减轻刑罚虽然是正确的人权做法,但年龄上感觉有待商榷。”类似的事件让大家都有这样的感受。 好在2021年3月,未成年人犯罪不承担刑事责任的年限下调,可见官方还是相当在意群众呼声和看法的。 第81章 分成模式 2013年的12月6日,几件重要的事情都赶在了同一天。 最重要的一件事,谷歌发来了他们拟定的分成合同,有关孟繁岐的ai技术应当如何分取利润,这里面的门道前所未有的多。 孟繁岐此前与白度签订的只是单一技术的服务合同,单单只是一个图像的实时检测算法,需要约定的东西已经相当之多了。 而如今,孟繁岐需要与谷歌约定各种类型的技术该如何分成。 众所周知,技术有赚钱的,也有不赚钱的。有看上去亏了实际赚了的,也有看起来赚了实际上血亏的。 自动驾驶汽车和类人机器人这样的划时代产品如果能市场化,毫无疑问将带来巨额利润,但这仍然遥远,处于纯砸钱阶段。 针对可以马上变现的技术,和不那么容易变现但很重要的技术,以及纯投入研发,虽然不变现但是谷歌非常希望突破的。 不同类型的技术和方向,分成的方式错综复杂。 谷歌的合同在这方面叠甲叠得很厚,按理说孟繁岐目前发布的技术都是纯图像方面的技术,但这份合同里仍旧把很多其他类型的技术都约定在里面了。 非常严谨,严密。 比如对谷歌来说,到底什么技术现在变现最快,收入最高? 毋庸置疑的,那必须是广告收入,谷歌一个季度的广告收入通常约200亿美金,占据其总收入的八成以上。 收成好的时候,一年累计下来接近千亿美金,是支撑谷歌所有项目的立足之本。 目前,对谷歌来说有价值的赚钱方式是,越来越精确地预测用户的点击选择。 根据其内部的统计,即便只是百分之01的精确度改善,都将产生数亿美元的额外收入。 如果孟繁岐做出推荐算法的突破,那自然而然就可以直接进行测试,如果效果很好,那就直接上线部署。 这种情况下的分成非常简单,多给公司带来了多少收入,就按比例去抽成,很好理解。 外行们可能很难理解,技术提升之后多出的收入如何统计。 实际上,有关推荐算法,用户点击的意愿提升了多少,消费意愿提升了多少,多年以来都是谷歌最大的进项。 因此内部有关这方面的算法和统计是极其先进的,每个季度对于下个季度广告收入的预测都相当精准。 孟繁岐的经历以图像算法为主,自然语言和大模型了解过不少,推荐算法这方面懂得就不那么多了。 不过好在现在时间尚早,虽然孟繁岐毕业之后就很少再关注推荐和广告方面的算法,但是截止到2018-2019年左右的经典算法他还是有些印象的。 尤其是谷歌脸书和阿狸企鹅这些大公司出品的一些论文,还是仔细读过好几次的。 “要不是看合同我都忘了,谷歌其实是隐藏得很深的广告公司啊”孟繁岐喃喃自语道,世人都觉得谷歌是科技巨头,但它主要收入全靠广告,其余的部分只占不到两成。 “如果是这样的话,我这几个月首要的任务其实应该是推荐和广告算法了。”孟繁岐思忖了一下,谷歌给这方面的分成很高,一两年内达到2-3成,但往后会逐渐稀释,只有前两年给提得多。 倘若孟繁岐现在使用谷歌15-16年比较经典的推荐算法,孟繁岐个人预计给谷歌来带的广告收益提升会在百分之五到十之间,接近百亿美金。 2-3成就是二十多亿美金,两年就是接近五十亿美金,这会是他现阶段能拿到的最恐怖的一笔收入。 谷歌实际上也通过了一些方式来限制孟繁岐的分成,主要是合作者模式,倘若技术成果中有谷歌人员或者其他人员的参与,孟繁岐的贡献度要被稀释。 比如说,如果该推荐算法是由他和谷歌四位员工一起完成,那即便他处于主导地位,可能最后也只统计百分之三十到三十五的贡献度。 而其他人又没有分成合约,并无分成的权利,二十亿的分成就直接变成了五六亿左右。 这种技术的推出,往往团队超过十几人二十人都是很可能的,分到孟繁岐这里甚至可能只剩下大几千万美金,资本家的一手好算盘。 只可惜谷歌怎么也没有想到,孟繁岐绝大部分时候并不需要合作者协助。 成本节约类型的技术突破,分成的方式也类似,可以按3成抽一年。 科技公司的成熟技术迭代很快,时间久了之后技术效果会不好计算,因此普遍给出的分成期限都比较短。 不过好在比例不低,并且来得快,孟繁岐还是相当满意的。 而有关目前不能变现的技术,则是长期分成的形式,分成的比例可能更低一些,但也看该技术在盈利中所占的比重。 总体来说孟繁岐其实已经相当满意了,因为谷歌针对他所做的一些操作都是他完全不担心的。 比如用合作者来稀释技术的贡献比重。 再比如不能变现的技术长期分成,如果你研发的技术最后不赚钱,那就一分钱都没得。 可孟繁岐偏偏又知道哪些技术反响最好,来钱最多。 可以说是彻彻底底地拿捏住了。 这日下午,孟繁岐终于在韩辞的帮助之下,把现在的合同给彻底看完了两遍。 按照这个分成的比例,孟繁岐有信心在2014年一年,直接薅走谷歌至少二十亿美金。 这比谷歌原本开出的两千万美金两年的签字费可高出实在太多了。 对赌式的分成合约魅力就在于此,而即便是谷歌这样的科技巨头,也是没法在对赌中胜过重生人士的。 只可惜,孟繁岐仍旧不满足,换了前天第一次见面的时候看到这份合同,他一定二话不说,直接就签了。 可今天,孟繁岐得知了白度与燕京常平区已经达成合作关系的这一情报,这就说明白度今天晚些时候的技术发布会,将会把自己的身价和地位再提高一个等级。 “谷歌刚刚已经有人来催了,不知道你考虑得如何?” 拿到合同后,孟繁岐需要一间安静的屋子仔细地阅读这些条款,整个过程还是很久的。 外面谷歌来过一次人询问情况,唐璜刘旭等人将消息发到了协助孟繁岐阅读的韩辞那边。 韩辞一直没有提这件事,一直到孟繁岐将合同全部阅读完毕,放到一边。 “让他们再等等,晚上还有好戏。” 第82章 狠狠地吹牛 当日下午,临近发布会的时间段,白度的直播频道已经开始播放起了一些背景短片。 基本上是一些介绍白度这几年来投入的力度和成果的内容。 短短几分钟的时间,里面还插播了一条广告,让孟繁岐有些无语凝噎。 当真是一分钱也舍不得少赚。 切换到“白度实时检测新闻发布会”字样的海报界面又等待了几分钟之后,镜头终于给到了现场。 起初,全场一片漆黑,大银幕自黑暗之中开始播放一个以黑色为主基调的开场视频。 主要由象形文字说起,引出了图形图像对人类的重要历史意义。 一番眼花缭乱的历史事件,伴随着画外音对这些故事娓娓道来,最后留下一句短语在荧幕的正中央。 “ai看到的世界是怎样的?” “有请白度创始人,董事长兼首席执行官,李彦弘!” 现场的灯光陡然打亮,李彦弘还是一身经典的黑西装裤白衬衫的打扮,大步向前。 最近的各方谈判进展都十分顺利,甚至飞速地和燕京这一华国最重要城市的一个区达成了合作,很快就能试点。 除了一些类似于道路检测的功能,还无法解决之外,李彦弘最近可以说是春风得意。 “尊敬的各位来宾,各位媒体界,技术界的朋友们,欢迎来到白度,来到本次白度检测的新闻发布会。感谢大家一直以来对我们的关注和支持。” “自从白度几年前决定巨资发展ai方向以来,就不停得有人问我,ai技术什么时候可以落地,什么时候可以发布。” “一路走来,白度的选择其实受到了不少的质疑,不仅是外部的质疑,在内部其实也有很多疑问,因为毕竟ai方向的研发投入成本还是相当之高的。” “但在今天呢,我们非常荣幸地宣布,白度已经有了第一个功能非常强大,完全已经具备实际应用水平,可以广泛投入使用的视觉技术,那就是白度最新的实时图像、视频检测技术,白度检测。” 李彦弘说到这里,侧身遥控了一下幻灯片,身后大约三人高,大几十米宽的大屏幕上便浮现出了“智慧交通”、“智慧工业”,‘智慧医疗’,“智慧安防”,“智慧生活”五个主题,也就是白度主要想推的五个应用场景。 “当然了,我在这里也需要特别感谢,我们白度深度学习研究院的特约研究员,孟繁岐。”简短介绍完算法的主要应用方向之后,李彦弘如约地替算法的作者孟繁岐打了一个广告,当然了,话里话外也顺带给白度贴了不少金。 背后的无敌大宽屏上突然在左侧并排出现了孟繁岐和李彦弘的证件照,也就是上次专门拍摄的那张。右边则放了一些两人讨论,交流的摆拍。看得孟繁岐有些脸红。 “孟同学对我们本次算法产品的贡献很大,基本独立完成了最核心的部分。我们非常惊喜,且欣慰可以有这样优秀的技术产生,在过去的一段时间内,我们针对各行各业的情况和需求做了许多的调研。” “下面呢,我们用五个演示,去分别展现一下白度检测在实际生活和工作中的巨大潜力和威力。” “我们先看一个智慧交通的例子。”李彦弘侧身回头,指着大银幕上一个车内视角的图像,“可以看到,白度检测算法,已经可以准确地识别红绿灯,限速牌,各类提醒的标志。相比以传统传感器为主的自动驾驶方式,通过图像去识别路况已经逐渐成为可能。”李彦弘其实真的很想把政府的那个需求作为演示放上来,只可惜尝试了好几天,终究还是失败了,因此只得退而求其次,选了一个自动驾驶场景。 效果其实也还不错。 “再看一个智慧工业的例子,我们可以非常快捷地对大量工业材料进行检测和数量统计,又或者是特定类型的检测,比如检测缺陷,协助次品筛查。” 在这方面,白度和几家冶金公司进行了初步合作,对方给出了少量的图片,初步的实验效果相当理想。 智慧医疗方面,李彦弘则从医护工作者负担重,华国患者病人多的角度入手,提出白度检测的快捷可以极大地减轻繁重的重复筛查工作。 “这方面的进展应该没有那么顺利。”孟繁岐在一旁点评道,“医疗方面毕竟是需要担很大责任的事情,还是有不小的阻力的。” 虽然几年后医疗方向的ai公司如雨后春笋一般,但在现阶段,还是需要经历漫长的谈判推拉过程的。 “而在智慧安防方面,白度检测系统可以广泛用于各类监控场景,针对特定的物体和状况进行提醒和警报,可以数百倍地节约人力和精力。” “我们的技术推出后,恰巧在昨日,有了第一次的实际运用,协助燕京常平分局破获了一起性质极其恶劣的杀人案件。” 李彦弘的表情带着一些沉重,“我们由衷地希望,这样的功能永远都不需要用到。但我们同时也需要做到,一旦事情发生就要迅速做出反应,不给凶手任何逃脱的机会。” “本次案件中,得益于白度检测的帮助,警方将原本需要二十到三十小时的监控排查工作缩短至一小时内,距离报案时间不足六小时即将凶手抓捕归案。” “我想这就是白度检测最好的实力证明。” 屏幕上显现出常平警方的感谢信,这比什么案例和演示都更加直接有效。 “同时,我也希望大家可以关注这起案件,能够给与生者一些帮助。” “李彦弘这事做得还算地道。”麦芒看到这里,心头的恶气稍缓了一些。这件事结合新技术在白度的新闻发布会中提到,舆论关注度想必会大幅提升。 虽然被舆论裹挟的司法不是什么好事,可很多时候就无奈在,没有舆论就很难取得正义。 于此同时,田云胜局长不知道正在和谁通话当中。 “老王啊,你说话可是要注意分寸,尸检报告会有相应部分的法医出具,你到时候自己去看不就好了,给我打电话做什么呢?” “你提钱可就是侮辱我了啊,希望你自重。”田云胜大义凛然地挂掉了电话。 什么蠢狗商人,也不看看多少人盯着这边,还在想着拿几个臭钱摆平事情。 有钱拿也得有命花不是? 如此想着,田局长关掉了白度的发布会视频网页。 第83章 谷歌妥协 如果说前面的发布内容只是所有人意料之中的普通展示和介绍,那么这次在安全方面对具体案件的意外协助,可以说非常巧合地让白度检测的可信、可靠程度上了几个档次。 就华国的情况来说,官方合作、赞扬过的东西总是安全很多的。 李彦弘继续往后,介绍了一些生活上的使用场景,但在孟繁岐看来,这些内容还相当勉强。 目前阶段,实时检测类型的技术对个人生活还谈不上什么裨益,最多只能作为一时的玩具。 介绍完所有的场景,并展示了几个重要使用案例之后,李彦弘以“人工智能会改变每一个行业,白度检测就是最好的证明”为结尾,结束了ceo的展示环节,将时间留给了汪海峰去介绍一些数据参数和具体细节。 如果说李彦弘在前面的讲述还有ppt吹牛的嫌疑,没有拿出真正的干货让所有人信服的话。 当汪海峰直接拿着摄像头出场的那一刻,一切的质疑都显得十分无力。 汪海峰在上台的同时,身边还带着几位白度的工作人员,他们跟在汪海峰的后面,将一个很大的移动柜推至舞台的正中央。 柜子上面拜访了许多物体的模型,有十分逼真的那一款,也有比较q版的形象。 而走在前面的的汪海峰,手里拿着一个笔记本电脑,以及一个手持的外接摄像头。 “这是要复刻我当时说服他们的那一套做法啊。”孟繁岐看到这里会心一笑,什么ppt啊,参数啊,给人的感受都不够具体。 唯有这样最直接的演示形式,能够给人最强烈的感官冲击。 说一千道一万,都不如掏出来直接给人看一看。 这一点当时三位被孟繁岐说服的白度高层感触最深。 “就在几年前,我们这些研究人员都普遍认为,让电脑去分辨物体的区别几乎是不可能的。而现在,我们不仅可以清楚的知道图像中的物体是什么,我们甚至可以精确地标注它们的相对位置。” 汪海峰展示了一张内含许多物品的图像,每个物体都被清楚地标注了类别和位置。 “但有一件事情始终没有得到妥善的解决,那就是检测的速度。” 汪海峰调转镜头对准自己,说道,“这是目前业界最先进最精确的r-n算法,我们可以看到,他准确地预测了我的存在,但它实在太慢了。” 汪海峰一边说,一边慢慢踱步,但即便是这样一秒钟才走半米的移动速度,r-n算法已经无法及时地跟上。 “而这,是目前业界中,在精确度有一定水准的情况下,最快的方法。” 汪海峰走了几步上前,更换了运行的算法,“他的速度大概在十几二十帧左右,其实要按电影的帧数来看,似乎人眼已经可以接受这个数字。” 说着,他快速跑动了几步,原本已经位置正确的选框就又再次无法跟上。 “而现在,我们将要介绍的,是一款可以以100+的帧数运行的实时检测算法。” 汪海峰在舞台的中央旋转,跳跃,左右横跳,但预测框始终随着他的身体丝滑地扩大缩小,移动位置。 等他再次回到舞台的中央,什么话都没有说,全场却自发地响起了热烈的掌声。 这是对新技术的鼓励,支持和由衷的赞叹。 在场的绝大部分人都是第一次了解这方面的知识,他们所受到的震撼远比汪海峰当时看到这个技术要更大。 而舆论场上,有关白度检测的风评也开始全面提升,热度猛涨。 “卧槽了,李彦弘这回特么的来真的啊?” “快点来个懂哥介绍下,这东西可信吗?” “那兄弟才多大啊,20?21?我刚刚没看清,这就跟华国首富照片放一起上白度发布会了?” “啊!我好像对他有点印象,前段时间那个什么肘子,是不是还提过他?” “真要是一两百的fps就是在太厉害了,至少领先世界水平一两年。”评论中,也有个别比较清楚该方向进展的。 同一时刻,最为紧张的还是谷歌方面的人。 本次与去年争取辛顿团队时的情况不同,孟繁岐已经和白度开展了合作,并且看起来那是相当成功啊。 都说争取一家大厂意向书最好的办法是另一家大厂的意向书,虽说白度比谷歌这时候逊色了不少,但孟繁岐此时拿来谈判的资本可不只是一封意向书那么简单,而是相当扎实的技术成果,可以落地商用的那种。 就只是这不到一小时的发布会时间,百度的股价已经由173一路飞涨到了195。 实时检测算法其实并不能短期就带来巨额的利润,不过资本和民众们显然都对后续的发展十分看好。 汪海峰又转过镜头来对着移动柜子上的物品展示了一下,“我们已经可以让一个单一网络识别数十甚至上百个不同各类别的物体。” 随即,他又将镜头举了起来,直接对着台下密密麻麻的观众。 稍微放大镜头,屏幕上清楚地预测出了几乎每一个人。 “这项成果的速度和轻量,使得我们不仅可以在gpu和电脑上运行这个算法,我们的手机已经开始负担得起这样的运算。” 汪海峰掏出了自己的苹果手机,并在上面简单地演示了一下效果。 这是白度ios系统开发组连续工作了好几天加班加点的产物,把孟繁岐在显卡上的操作,尽量原样地搬到了手机的硬件和系统上进行操作。 虽然在手机上速度慢了几倍,但在原本一两百的帧数上,即便慢了几倍,也仍旧在可以理解和接受的范畴内。 “并且,我们将在6-12个月内,将该技术的原理和代码开源!”汪海峰举起右手,非常振奋地宣布道。 这个承诺又引发了现场潮水一般的掌声。 孟繁岐几人在屏幕面前笑道,“先是半年到一年占稳了市场,然后开源技术和代码吸引爱好者为社区做贡献,结果还能说得像是做了一件大好事。” 有点小聪明在里面,但愿意开源终归是好事。 杰夫看到这里,心中很是忐忑。 虽然给到自己的权限额还没有用到极限,杰夫还有继续往下谈的空间,但让一个20出头的年轻人将自己恰好逼到底线上去开出最终的待遇。 这多少让他有些事态失控的感觉。 之前谈分成,杰夫已经联系过一次董事会。 若是这次最终没法拿下,自己还要回过头去再次联系董事会商量待遇的事情,那就实在太不专业,丢人丢大了。 第84章 内部权限 孟繁岐曾经数次幻想过重生相关的场景,其中第一步就是发布残差网络来到这个会场。 在他的想象中,这个时刻才是事业真正的开始。 但没有想到的是,科技巨头们的嗅觉远比他的臆想要敏锐很多。 在12月7日的这次报告之前,谷歌和白度就已经和自己分别签订了合同。 杰夫代表谷歌最后与孟繁岐签订合同的时候,也是感到一阵阵肉疼。 这在谷歌挖人才的历史上也算是排得上号的优厚合同了。 分成的比例最终基本都定在了最高的3成,1-2年,然后1成三年的水准。 全都是杰夫给出的草稿合同中最极限的待遇。 “这下每年搞不好要分出去接近一个亿美金了。”这是杰夫和相关董事们心里的最坏打算。 他们完全料想不到,孟繁岐短短2-3年内从谷歌分走的利润会是一个再大几十倍的恐怖数字。 并在此基础上依靠投资和创业,成为了史上最年轻也最快白手起家的百亿美金富豪。 这让他在一群五六十岁的老头中显得格外显眼。 没有依靠任何人的投资,这就是技术的价值和力量。 “不得不说,你是第一个让我如此纠结的人。”7日这天的会议开始前,杰夫终于在西尼会场和孟繁岐签署了合同。 他苦笑着和孟繁岐握了握手,通常来说,他宁可选择放弃也不会让步到这个境地。 但辛顿说服他相信,孟繁岐在ai研究上的天赋和学术品味都是他前所未见的。 为了公司在ai方向上的未来,他用自己在谷歌的地位向董事会做了担保。 “合同既然签署,我就准备开展相关研究了。”孟繁岐对这个最终版本心满意足,虽然他的技术很强,但世界上这时间也找不到比谷歌更好的平台了。 如果真的搞砸了,对他来说也是非常被动的事情。 “虽然我要迟几个月才能到达美国,但我和谷歌合作的意愿是非常强烈的,我已经有了一些想法,需要你们相关的数据和材料来验证。” 孟繁岐不大清楚2020年后谷歌的先进推荐广告算法,但是16-19时间段的经典论文还是看过。 这些技术需要谷歌内部的客户行为数据,才能将模型训练得好。 这也是为什么ai越发展到后面越像是垄断行业,形成门槛的不是技术,反而是高质量的海量数据,和需要的恐怖计算能力。 “这当然没有问题,现在合同已经签订,我们会交给你相应权限的内部账号。相应的内部数据和材料你都可以接触得到,但要小心泄露的问题。”杰夫提醒道。 内部的这些东西一旦泄露,按合同所需的赔偿可不少。 “比较常见的问题都有相关的入职文档和指引,如果有什么需要帮助的,可以随时和我的学生阿里克斯和伊利亚讨论。”辛顿还是相当看好孟繁岐的。 阿里克斯和伊利亚?开局和chatgpt首席技术官一起打工? 这感觉还真不错。 美国博士的毕业还是比较漫长的,因此阿里克斯和伊利亚的年纪基本和孟繁岐重生前差不太多,交流起来还算是通畅。 尤其是伊利亚,他此刻正在专注于seq-to-seq相关问题的研究,也就是一个语句到一个语句的任务,比如翻译和对话。 由于后世的chatgpt是ai历史上普及率最高,震撼程度也最高的产品,国内所有的大厂都试图复制这项技术。 因而孟繁岐在自然语言领域,最熟悉的就是伊利亚这一条道路。 在之前的短暂交流当中,伊利亚感觉自己比较困惑不解的地方,孟繁岐总是能够为自己指点迷津,顿时服气了。 “天才果然还是天才,完全不讲道理。”伊利亚其实本身也算是天之骄子了,“他明明主要在视觉方面做研究,对自然语言问题却理解得比我还深刻。” 伊利亚很快被折服,并暗下决心多和孟繁岐进行交流合作。 “那我方便先了解一下谷歌现在推荐和广告算法内部迭代的流程和验证指标吗?” 谷歌方面早已把内部账号准备好,孟繁岐登陆进去之后看了一圈,不少东西还是比较熟悉的。 比如谷歌的代码规范,这个是后来华国许多大厂代码规范的蓝本,因此孟繁岐基本熟悉。 至于一些内部的工具,虽然不少孟繁岐没有用过,但也声名在外,有所耳闻。 因此大多数功能很快就上手了。 代码管理仓库里,大部分与自己无关的内容都没有开放权限给自己,其实这个也不要紧,开放了他也看不懂。 比如谷歌浏览器的源码,很早就开源了,但一般人根本没那个能力搞懂。 代码量庞大复杂,即便是别人写的总结,孟繁岐都看不太明白。 他主要关注的还是ai相关的几个算法方向,谷歌内部的进展还是挺快的,自己得抓紧点先做几个变现快的技术。 然后再慢慢搞ai方面的突破。 “广告算法和推荐算法?”杰夫和辛顿都是一脸问号。 如果说图像算法和语言算法还有不少共通之处的话,推荐和广告则就是差别很大的一个领域了。 目前这两年,图像方面突破最快,语言次之。 孟繁岐自己这几个月就做出了三个重大图像成果。 杰夫还指望着他在谷歌大脑再创佳绩呢,结果小子怎么奔着推荐广告去了? 难道就是为了钱? 没错,就是为了钱,没有别的原因。 这方面的算法突破,可以直接抽谷歌8成以上收益的血,这吸引力可比其他方向的ai技术大太多了。 “你不准备继续做图像算法吗?”辛顿有些担忧,他是比较纯粹的学者,虽然早期被金钱困扰,但有了几千万后就不再关心钱的事情,而是安心做学术。 但目前看来,孟繁岐显然不是这样的人,他奔着钱最多的广告业务就去了,这样的功利心态让辛顿有些忧虑。 “也不是,我对推荐算法稍微有一点想法,只是之前个人一直没有数据支撑,我的重心还是放在图像和语言这边。” 孟繁岐只记得几个推荐算法,得快点做出来变现。再过几年他这方面的水平就跟不上了,想一直做也做不下去。 听到这句话,辛顿心中稍稍宽慰了一些。 第85章 首次登台 西尼这次给到ia-2013竞赛的会场并不是很大,满打满算坐下一两百人已经了不得了。 孟繁岐与韩辞两人作为需要上台的演讲者,被安排坐在了第一排,唐璜的名字在参赛队伍里,因此沾光也坐在了前面,其余诸人就只得排在后面,连个座位都没有,因为人实在来得太多了。 主办方也没有想到,这次的来客会远远超过了预期的数量,因此即便加了好几排座椅也没有办法,来得晚的人就只能站着。 孟繁岐回头张望了一下,发现其余三人在最后面罚站,都在笑着冲他招手。 就在孟繁岐忙着和谷歌谈判,钻研合同的这几天,他们几个人在国际计算机视觉大会的会场里到处转了转。 毕竟光是会议门票也得好几百美元,不能浪费了不是,转完一圈之后几人也感受颇深。 原来ai方向已经有了这么多大学,公司或者机构开始了研究,方向和种类如此繁多。 而这些学者和行业大牛们今天挤破了头,站在这个房间里也要来看的,正是自己同学的技术演讲。 虽然说到底跟自己毫无关系,但四人多多少少也觉得喜悦。 孟繁岐一眼扫过去,还是看到了不少熟悉的面孔的,其中有李飞飞这样已经成名,主办了赛事的知名教授。 也有贾扬清这样仍旧在读书参赛,目前尚且默默无闻的未来大牛。 众人都很期待今天的技术展示,究竟是什么魔法能够让千万图像上的千分类超过人类水平。 可现在的孟繁岐,主要的精力已经不在今天的展示之上了。 就在几个月前,他费尽心思只为了这次赛事的冠军,以博取世人的关注。但此时已经与两个科技巨头都签过合同的他,不再将这个赛事放在眼里。 可能这也是辛顿和阿里克斯等人今年没有参赛的原因,虽然成名之前,非常依赖这样的平台和机会。 但有了真正的事业之后,这样的比赛就显得有些无足轻重了。 唯有身边的韩辞仍在紧张,这可是一屋子的学者教授等着听她的想法呢。 孟繁岐的出色成绩,使得本次赛事其他队伍的结果和算法不值一提,已经没有什么人在关心。 这多少让努力了好几个月的其他参赛者有些沮丧。 不过比起对新算法的期待和好奇,这一点点情绪算不了什么。 可能也是清楚,等孟繁岐介绍完自己的算法之后,其他队伍的演讲可能就会无人问津。 主办方特意将他的顺序放在了最后。 否则万一第一个让他上去,讲完之后一屋子人走掉一半,又或者是在后续别人演讲的时候抓着孟繁岐去讨论,那就有些尴尬了。 台上诸人演讲的内容,无非就是复现去年阿里克斯的算法,加一点点自己的小改动。 暴力地将各种魔改过的模型堆在一起,没有太多的新想法在里面。 看了一眼身边阿里克斯本人,孟繁岐心说,现在就连阿里克斯也得跟我请教网络结构设计。 这样的内容,属实多听无益,孟繁岐没有继续关注这些队伍的展示,而是对着电脑在查看谷歌的财报。 想要抽走谷歌最多的钱,就必须非常了解谷歌的广告收入结构和具体情况,它的钱是从哪里来的,比例分别是多少,又有哪些自己可以做的。 虽然了解一些谷歌的经典推荐和广告算法,但是孟繁岐还从未自己看过谷歌的财报,对谷歌的收入结构了解得非常笼统。 只知道搜索和广告收入占了谷歌8成的总收入。 根据过去几年的财报来看,谷歌当之无愧是世界广告第一人。 它大约占据了全世界所有广告收入的百分之30。 作为对比,孟繁岐大概了解,2020年左右,整个阿狸系的广告份额占比,大约是百分之8-9左右。 也就是一个谷歌基本上能顶四个阿狸系的广告市场占比。 而在谷歌的所有搜索和广告收入当中,搜索又占据了绝对的大头,大约百分之70的比例。 其实谷歌也做竞价排名,和白度一样。 只不过谷歌的做法更加多元化一些,更加隐蔽,广告商们可以选择不同的竞价策略。 谷歌允许,也有那个技术实力进行相当精准地广告和搜索结果投放。 具体到你的地理位置,常用语言,个人兴趣等等。 因此他的广告远比白度要藏得隐蔽,不那么硬塞给你,虽然本质上性质其实没有什么区别。 “也就是说,我的首要任务是完成搜索推荐算法的优化,其次才是广告投放策略。” 至于youtube视频,竟然才只占据广告总收入的十分之一。孟繁岐看到这里微微皱眉。 所有的广告商们,最爱的就是视频这种形式,youtube作为世界上最大的视频网站,广告投放的收益竟然远比搜索方面低。 “看来我还是低估了文字信息的力量。”孟繁岐仔细想了一下,现阶段谷歌缺乏识别视频中信息的能力。 因此对于视频用户的喜好,远不如对网页用户的喜好把握得好,把握得准。 “这个方向我需要重点投入一下。”搜索方面是谷歌的王牌收入方向,而自己的收成是按照额外提升的收益去分成。 虽然搜索的收入在谷歌的占比是视频的七倍,但这部分和他的抽成并无关系,他只能抽额外优化出来的收益部分。 孟繁岐认为,视频广告这里的空间可能不比搜索要小,而且是他最擅长的视觉领域,反而是纯广告可以排在最后面。 正埋头钻研着,不知不觉,就已经要轮到他上台展示了。 后面不知情的人都以为,神奇的孟一直到会场都还在积极学习,一直低头盯着电脑钻研技术,难怪能出这么多如此牛的成果。 只有坐在他旁边的杰夫看得清楚,这小子压根就是在研究哪个技术能分钱分得多。 看财报选技术,这辈子第一次见。 “好了,我想大家也都等不及了,我们都心知肚明,谁才是今天会场人头攒动的真正原因!”最后一支队伍下去后,主持人上来带着笑意说道,“让我们欢迎视觉领域的新星,孟!为我们讲解他在图像识别领域的巨大突破!” 第86章 视觉新范式 会议的主持人面带笑容,宣布孟繁岐隆重登场。 孟繁岐沉迷分成的计算,正在畅想美好的未来,完全没有感觉到时间竟然过得如此之快。 连忙关掉谷歌的财报,缓步登台。 看着台下满满一教室的ai领域学者们,都翘首以盼,用十分期待的目光看着自己,孟繁岐发觉自己远没有想象的那么紧张。 “大家好,这个报告的主题主要是应用于图像领域的深度残差学习。我知道大家可能主要是为它在图像识别领域取得的成绩而来的。” 说到这里,孟繁岐顿了一秒,台下响起了会心的笑声。 “不过在这样的场合,我个人并不希望花费太多的时间在具体的细节上面,相关的论文和代码在最近一段时间会陆续地开源,对细节感兴趣的朋友可以自己去探索。” 与谷歌签下合同之后,孟繁岐手头的所有论文也就没有继续压在手里的必要了。 借着发布会和这次国际会议的热度,他准备直接全部公之于众。 当然,这部分内容现在需要先经过谷歌的首肯和内部审阅才可以发布出去,以免它们可能导致谷歌的利益有损失。 不过由于这部分技术内容大都是图像算法领域的,目前还没有涉及到谷歌的关键利益。 若是等几周后,孟繁岐将对谷歌推荐和广告算法的一系列策略做出来之后,想要公布这部分技术,谷歌是万万不可能会答应的。 不涉及核心利益的情况下,谷歌在这些技术方面一向还是非常大方的,在经过杰夫和辛顿的审阅之后,孟繁岐已经准备先后把之前攒下的部分工作公布出去。 在大会开始之前,以drea为首的部分论文已经可以在arxiv上直接阅读到。 刚才其他队伍在上面介绍自己做法的时候,其实也有很多人像孟繁岐看财报一样,在偷偷阅读drea的论文。 “虽然赛事的主题是图像的识别分类,但如此多学者聚集在一起的机会确实不多,我希望同时把其他方面的一些内容一起在这里展示一下。” 视觉顶会有三个,分别是本次孟繁岐参加的国际计算机视觉大会,iv。 还有欧洲计算机视觉会议,ev,一个偏欧洲一点的会议。 这两个都是两年一办,所以一年也只有两次这样国际顶级的会议机会。 唯一一个每年都举办的,是cvpr,国际计算机视觉和模式识别大会。 但它的举办地点基本上都在美国,签证方面经常会有一些问题。 本次的机会比较难得,当然要多宣传一下自己的工作。 “基于drea的残差思想,不仅在图像的识别分类上取得了巨大的突破,我同时也衍生出了它的一些变体,比如生成式网络,检测网络,还有分割网络。” 识别分类有竞赛结果,生成式网络的论文已经放出,而检测的网络随着白度的发布会,大家也已经了解它的威力。 至于分割网络,则是这两天随着drea的论文一起放出的u-工作。至此,可以说视觉类几大任务的基础范式已经被孟繁岐奠基。 今后不论是识别分类,分割检测,还是迁移生成,都很难绕得开这些轻便又好用的办法了。 “可以看到,这种思想席卷视觉领域之后,使得目前主要的研究方向都有了颠覆性的突破。” 孟繁岐将这几篇论文的主要试验结论摆在了幻灯片的第二页,就是要先以结果震撼众人。 “显然,这些算法在诸多领域都与第二名拉开了巨大的差距,而相当一部分的功劳应当属于残差思想对网络深度的革命。” “在10年11年,我们仍在使用人工设计的sift,hog还有sv,12年,阿里克斯的八层alex取得了巨大的突破。” “而今年,残差思想引发的深度革命,使得训练150+层的神经网络成为可能。” “深度神经网络是很多任务场景,尤其是视觉任务场景的基础引擎和骨干,这也是为什么它能够迅速影响几个主流的任务。” “从结构上看,drea并没有什么特别的,比起之前每一层都单独设计的网络,我其实故意希望它变得简单,重复。” 孟繁岐身后的幻灯片展示了一个极其细长的图案,这就是一百多层深的drea结构图。 放大展示它的基本设计,众人发现,它的单层设计非常简洁朴素,只采用了最常规的算子操作。 长长的结构图滚动了起来,观众们都发现,原来每一层并没有任何区别,只是单纯在重复。 由于一百多层的滚动需要太久,在这个严肃的场合显得有些喜感,场内发出了一阵阵笑声。 “那么这里就引出了一个问题,那就是是否单纯地把网络做大作深,就总是可以取得更好的结果呢?” 孟繁岐的这个问题,直到2023年也没有一个理论上的答复,但很显然,巨大的模型还在持续地创造一个个奇迹。 不管是绘画,对话,还是图像操作,都还远没有到达极限。 “我非常希望自己能够清楚地从理论上告诉大家这个答案,但由于能力有限,我也只能给出自己的猜测,那就是yes。” “我相信,只要更多更好的gpu,更多更好的数据,以及更大大模型和更好的优化办法,我们就可以持续地创造奇迹。” “而之前的网络在深度上遇到的阻碍,我认为并不是网络的能力问题,而是我们没有找到合适的办法去优化好它。” 让网络多重复几次,这是很多人都试过的事情,很显然,得到的结果是比原本要差的。 这在传统方法中,不是什么奇怪的现象,很多人都将这个现象解释为维度灾难或者过拟合,没有进行足够深度的探索。 “稍加思索,这显然是一个反直觉的现象,对于更深的网络,我们完全可以将小版本网络的所有参数复制进来,而多出来的部分只要什么事情都不做,这个模型就至少不会更差。” “但事实上,却并非如此,我相信很多人都观察到了这样的普遍现象,那就是更深的模型反而变差了不少。” 第87章 希望斯坦福自觉一点 “因此,我认为更深的网络没有取得更好的结果是一个优化问题,而不是一个模型设计问题,又或者是模型能力问题。模型本身是有更大的潜力的,只是优化的方式需要改变。” “而这就是深度残差的意义所在。” “对于我们需要学习的任意一个映射h(x),我期待网络去学习一个f(x)+ x = h(x)中的f(x),而不是直接学习h(x)本身。” “这个操作可以简单的通过增加一个加法实现,而距离h(x)差值为x本身的f(x),我们称之为关于恒等的残差映射。” “如果这个恒等是理想的,那我们很容易将权重设置为很小的值。残差的形式很好地解决了一直以来都比较麻烦的梯度问题,可以看到,它使得上百层的网络可以持续地取得更好的性能。” “在本次竞赛的识别分类上取得的成绩,只是残差思想最基础的体现,实际上,它是更好的特征提取器,可以更好地提取图像的特征以应用到各种图像任务中去。” “不仅是本次竞赛的检测赛道,前两天白度的技术发布会上,想必大家也看到了明显的性能提升。” 说到这里,孟繁岐顿了一下,因为台下已经控制不住地开始议论纷纷。 虽然白度宣布了实时检测办法主要由孟繁岐这个特约研究员贡献,但对于具体的算法细节守口如瓶,什么也没有提。 只是承诺要等到6-12个月后会公布。 虽然众人大概都已经猜到,但听孟繁岐亲口说出,众人至少确定了一件事,那就是白度现在领先世界一大截的实时检测算法,是采用了drea的。 “当然了,视觉类的任务还有非常多,除了我已经做过的生成,检测,分割,识别之外,还有姿态估计,深度估计,超分辨率等等等等。种类繁多,不一而足。” “我的drea论文已经公布,代码也已经开源,还有很多的方向需要大家一起去探索。” 孟繁岐吃了体量最大的几个赛道的蛋糕,自然也得留点汤给其他人。 在某个比较具体的方向,有几个十分得到认可的代表作就够了。 孟繁岐技术多得发不完,没必要把细分领域都一个个去自己做。 说白了就是稍微改改去让机器运行的事情,换一下数据,稍微调整下个别结构和参数。 把代码开源出来,让越来越多的工作基于自己的技术和算法去进行,是性价比更高的做法。 孟繁岐讲到这里,其实总共才用到十分钟。 按照原本的计划,他是可以讲到大约25-30分钟的。 只可惜腰包鼓了,硬气了,心态也变了。孟繁岐现在已经没有会见李彦弘之前的那种需要学界认可和认同的心理需求。 回想起来,在李彦弘的预支款打到账上之前,孟繁岐一直还是有一些担忧的,总觉得心里有点不安,希望得到认可。 有些怀疑自己到底能撬动多少资源。 如今,这些都是过去式了,没有了被人认可的需求,孟繁岐的展示变得精要了许多。 十分钟的时间其实在这种场合不算短了,尤其这次展示有两部分,孟繁岐结束之后还有韩辞的理论解释部分。 因此在场所有人都没有觉得异常,唯有韩辞目瞪口呆,啥情况啊,不是还该有十分钟吗?怎么这就到我了? “我在做这些研究的时候,获得了我们学校一位数学教授,付德清的许多帮助,他是论文的合作者,但并非我们领域的学者,因此没有意愿来参与本次会议。 有关残差思想为什么起到效果,它实际上又有什么意义,我们请付教授的师妹,韩辞为我们带来她的看法,从动力系统角度的解释。” 孟繁岐说完之后,准备往台下走,走了两步又折了回来,对着麦克风补充了一下。 “对了,由于我签约了谷歌,考虑到个人目前的学业情况仍在读本科,目前急需硅谷附近的大学能够收留一下我。” “希望斯坦福可以自觉一点,。” 说完,全场哄堂大笑。 本次参赛的队伍,都是什么微软,uc伯克利,圣彼得堡,ib,东大,新加坡国立,牛津,多伦多。 参会的人员水平也都不低,大都是世界一流的顶级名校和科技巨头的硕博学位拥有者。 这些人的结果都被完爆了几条街,人山人海地聚集在这里听孟繁岐介绍他的算法,这使得在场不了解内情的许多人,都完全忽视了孟繁岐如今本科学生的身份。 单就他已经公开的这些论文的质量和水准来说,博士毕业标准都够了。 网络结构,生成,分割,优化器和归一方法,明眼人都看得出来,这些思想将会成为新ai时代的基础范式。 甚至有两三个新方向上奠基式,挖坑式的开山工作。 根本没有人想到他还有这样的问题需要解决。 孟繁岐说完这句话下来,赛事的数据筹备人,斯坦福ai实验室的指导人之一,李飞飞直接开启了现场招生。 她前几年收集ia数据的时候,由于算法的能力和人类水平差距太多,因此李飞飞一直希望着以后某一天ai算法可以在自己收集的这个大规模数据上面超过人类。 她原以为这需要一二十年的时间,却未曾想一共用了不到五六年。 尤其是最近两年时间,精确度一共被爆刷百分之20,直接完成了她的愿望。 如今得偿所愿,而做到这件事的人又正巧在寻求斯坦福就读的机会,李飞飞自然不会放过。 而且,在2014年,斯坦福正好准备开始提供深度学习方向的课程,孟繁岐的加入对这件事也大大的有利。 李飞飞如此想着,完全没有感觉到自己的想法显得有些奇怪,招一个本科生,却想着让他协助大学提供课程质量。 真不知道招的是本科生还是讲师,这事情似乎显得稍微有些荒诞。 在场有不少牛津,剑桥,it,哈佛等名校的教授学者,本来听说他想要来美就读,都有招揽之意。 但听到孟繁岐说签约了谷歌,又点名斯坦福自觉一点,几位老教授多少还是有些包袱的人。 看到李飞飞和孟繁岐谈笑风生,也不好意思上前插话。 第88章 学界的偏爱 “来我这里读怎么样?让你直接从本科最后一年开始,毕业了直博,给你全奖。” 李飞飞坐在韩辞的位置上,开始和孟繁岐搭话。 “哈哈哈,全奖倒不是关键,我主要担心后面几年我可能没多少时间在学校。”孟繁岐笑道,斯坦福的学费不便宜,一年大约五六万美金,算上生活住宿费用,一年得要七八万美金。 对于普通学生来说,这是一笔天价费用,不少美国学生都需要借助学贷款,直到工作数年之后还有大量额度没有还清。 但几十万美金对孟繁岐来说,已经是可以忽略不计的数字了。 光是这几天白度股票涨幅带来的收益,就已经差不多超过五十万美金。 说起这部分股票,孟繁岐准备过几天就开始缓步分批出掉这些股份,在美股寻找一些有潜力的公司投资。 并且他已经与柳秘书联络过,把李彦弘那里预支的第二笔,共计一千八百万元打在了国内的账户上。 因为他突然想起,在目前这个时间点,似乎在国内还有笔钱可以白捡,而且是最后的窗口期。 那就是米忽悠,这个后来价值千亿的公司目前似乎还没有看到曙光。 “这个月中先去尚海走一趟。”孟繁岐并不记得几个非ai公司的情况,重生前很少关注这方面。 但米忽悠的经历着实还是比较离奇的,值得他走之前专门跑一趟尚海。 “不在学校也不要紧,哪里做研究不是做研究?”先不说李飞飞本身也跟谷歌联系甚密,如果学生自己能产出这样质量的学术成果,做导师的哪里还管那么多? “这么好?”孟繁岐其实也就是象征性读一个学位出来,没太把这件事放在心上。 这么多论文反正都要发,成果都要做,何不顺带拿个学位? 只要导师管的少就行,不指望导师提供多少指导和资源。 抛开他本身的独特优势,他此时也已经有了辛顿的指引和谷歌的资源,在这方面的条件基本上封顶了。 李飞飞显然也很清楚这一点,主打的就是一个宽松自由加优惠,“你直接来读本科最后一年,先把学分修了。毕业之后直接来我这里挂着读,文章就和谷歌合作直接出好了。” 不仅李飞飞本人和谷歌联系千丝万缕,17年更是直接正式担任过谷歌的副总裁,主要负责ai研究和与云系列产品的融合。 就连谷歌的两位主要创始人,谢尔盖·布林和拉里·佩奇,均为斯坦福的计算机科学博士生。 所以对斯坦福谷歌双方来说,孟繁岐一边在谷歌打工研究,一边在斯坦福读这些个学位,大家一家人不用分得那么清楚。 这也是孟繁岐点名斯坦福的主要原因。 “那就说好了?”在孟繁岐的角度,李飞飞是一个很不错的选择。 首先,她是移民华裔,对华国人也相当照顾。比如后来成为阿狸vp的贾扬清,在斯坦福的时候虽然不是李飞飞的学生,但也被其多次督促学习。 虽然目前地位还没有那么高,但后来是美国三院院士,在斯坦福ai圈内算得上第一流导师。 其次,她跟《自然》《美国国家科学院院刊》等顶级杂志,以及视觉三大顶级会议等组织的关系很不错,她的ia赛事经常在顶会上举办。 与她合作,自己的成果发布起来会轻松不少。凭借自己的成果质量,基本上几个会议的奖项可以说是预订了。 最后,她在谷歌的影响力,会一定程度上使得自己的成果更容易推动,乃至具体分成和其他的谷歌内部事情都会更加顺利一些。 在会场直接谋求入学斯坦福是孟繁岐之前就想好了的事情,因此他早就备好了纸质的简历和研究计划书等内容,甚至还包括辛顿帮忙写的推荐信。 可以说是非常有备无患了,辛顿也只得扼腕叹息,为何自己所在的学校偏偏远在加拿大,果然还是近水楼台先得月。 此时,台上的韩辞手忙脚乱了一番之后,开始了自己的展示部分。 “到目前为止,ai相关的学科发展,已经彻底改变了人们过去对ai的认识。孟的残差思想在许多图像任务上取得了令人叹为观止的成就。 比如比人类更精确地识别图片,又或者直接凭空生成完全不存在的图像。而这些了不起的成就,主要是通过求解的方式来完成。 例如,对于任一图像问题,我们感兴趣的是从图片到具体意义的映射函数,比如图像到它的内容的类别。 目前惯常的训练做法是,基于一个有限的数据,给出目标函数的一个高效逼近。又或者是利用没有标签的有限样本,逼近采用背后的未知概率。” “神经网络的基本组成部分即为:线性变换与一维非线性变换。深度神经网络,一般就是上述结构的反复复合。 对于已经构建的网络,设计一个最优化问题,根据经验误差去拟合数据,有时加上一些正则化项,并求解该优化问题。” 韩辞的幻灯片上开始展示密密麻麻的一些公式,“由此,我们便可以把误差分解成三部分,逼近误差完全由假设空间的选取所决定,估计误差由数据集的大小和质量而带来的额外误差,以及优化误差,这是由优化,或者说训练带来的额外误差。” 虽然之前已经大概了解了韩辞在这方面的想法,但在如此正式的场合,看到她有些紧张却仍旧十分自信的展示这些专业高深的内容。 孟繁岐还是相当敬佩的。 这里面的不少结论都是后来世人熟知的,不过大都是通过大量的实验观察,总结归纳出的一些经验性结论。 虽然今生,孟繁岐将会在诸多ai应用领域开天辟地,可内在的数理证明,终将是他两辈子都无法越过的鸿沟。 对那些可以做到这些事情的人,人们难免会另眼相待。 而此时此刻,会场当中,看好韩辞的并不只是懵懵懂懂觉得厉害的孟繁岐。 以辛顿为首的学院派,比如牛津团队的几位老教授,眼中满是赞许的目光。 这个待遇是连孟繁岐刚刚也没有的。 “可能这就是老学究们对于理论的偏爱。”孟繁岐笑着摇了摇头,自己这个做ai应用技术的,可能永远没有办法获得这几个怪老头的如此偏爱。 第89章 理论和应用 ai技术是比较少见的应用远大于理论的学科,但并非是没有理论。 孟繁岐目前为止产出的所有技术,其论文当中还是有这许多理论方面的论证和推衍的。 不过这部分内容大都源自于与付院长的讨论,属于是锦上添花,并非是孟繁岐的本意。 之所以会添加这些数理推衍,主要是因为早期的ai届仍旧相当看重这方面的论证。 这也是为什么那几个老学究听到韩辞内容的时候眼里放光,口中赞叹不绝。 而在听孟繁岐实验上的世界级突破时虽然赞叹,却没有这种由衷的兴奋。 对于醉心于理论的人来说,搞懂这个现象的理论原因到底是什么,远比做出影响世界的技术应用更加重要,也更加有吸引力。 也正是这种好奇心和对真理的探索,造就了人类一次次文明与技术的突破。 只是很遗憾的,在ai这条道路上,偏理论的方向注定会坎坷异常。 至少直至2023-2024年左右,仍旧没有什么像样的突破。 而孟繁岐在今后的论文当中,涉及理论的部分也只会越来越少,会更加注重工业应用方面的难点和内容。 “她是谁?你的同学吗?”辛顿听了韩辞对孟繁岐残差思想的解释之后,觉得思路一下子打开了不少。 如果从动力系统视角构建等价性,那数学和物理界的很多概念都可以引入进来,事情就大有可为了。 “她是燕京大学的,现在已经读了研究生了。”孟繁岐言下之意是,韩辞已经有导师了。 “她应该是搞应用数学的。”李飞飞可不像辛顿一样,恪守礼节。 在她看来,只要墙脚挖的好,没有学生找不到,“她导师是谁?” “鄂维南院士。”孟繁岐突然想到,李飞飞本科是普林斯顿的,搞不好和鄂维南有点交集。 鄂维南上世纪末开始在普林斯顿教过应用数学和计算数学,那段时间差不多正好是李飞飞在读本科的时候。 “行,我去想想办法,把她拐到这边来交流几年。”李飞飞嘿嘿一笑。虽然当年与鄂维南不熟,但怎么也算是听过对方课的,也算是半个学生。 在她看来,韩辞在ai数学和优化问题方面大有可为。 纯数学只要不解决大难题,终究是难出成果的,而搭上ai现在飞速发展的顺风车,则前途一片光明。 比如韩辞现在在讲述的残差思想,在数学和物理界都算不上什么高深的东西。 可结合孟繁岐的应用成果来展示,则大大的加分,意义非凡。 不同领域的交叉地带,一向是出成果的捷径。 台上,韩辞的讲述仍在继续。 “我们假设一个简单的高维积分问题,计算一个可以表示为期望的积分i(g),先通过有限求和i(g)来逼近。 若改用蒙特卡洛办法,从特定的独立同分布的抽样样本中选择n个样本,则有恒等式e(i(g)- i(g))2 = var(g)\/n, var(g)= eg2 -(eg)2) 这告诉我们收敛速度与维度无关。” “若我们先用传统傅里叶变换,再用均匀的离散傅里叶变换来逼近。其误差则~-a\/d,必然被维度所影响。 可,若一个函数可以表示成期望的形式,而令所有样本为独立同分布样本,则有拟合差值为var(f)\/,与维度无关。 若将两层神经网络写作该形式,则意味着,这一类期望函数均可由两层神经网络逼近,且其逼近速度与维度无关。” “让我们转向离散动力系统的视角,举一个随机控制问题。 动力模型zl+1 = zl + g1(z1,a1)+ n,其中z为状态,a为控制信号,n为噪声。若我们想寻找一个反馈控制信号函数,而通过求解动态规划贝尔曼方程,则必然会遭遇维度灾难问题。 该过程的性质,其实与残差网络等同。 ” “最后,我总结。深度学习根本上是高维中的数学问题。神经网络是高维函数逼近的有效手段,而残差网络则是更加容易优化的高维函数。 这意味着:数学处于科技创新的真正前沿,并且对新领域产生直接冲击。同时也为人工智能领域、科学以及技术领域提供了众多新的可能性。” 韩辞总共讲述的时间大约是孟繁岐的两倍,讲述完成之后,更是被几位老学究抓着反复提问,讨论。 半晌,主持人才找到机会重新登台,把孟繁岐又请了上去。 主持人看上去年纪不大,大约三十岁左右,估计是斯坦福的在读博士生或者刚毕业的讲师。 为人相当活跃,看热闹的不嫌事大,他将孟繁岐重新请上来之后,还开了一句玩笑。 “这次演讲本来是你的舞台,现在却被韩辞小姐抢去了不少风头和关注,不知道你作何感受?” 孟繁岐笑着接过话筒,等台下的笑声稍稍平息一些过后,十分大方地回答道,“我们专注应用方面的人,依靠得是代码说话。虽然我今天丝毫没有提到技术的实现和细节,但我想看了我代码的大家,都已经感受到了我的万语千言。” 台下的不少程序员闻言马上开始起哄,口哨声和呼声此起彼伏。 “我的梦想是自己的技术可以广泛地应用到世界各地,让ai智能就如空气一般,每个人都无法缺少,但在生活当中却又很少会注意到它们的存在。 至于ai的理论研究和探索,可能就要拜托韩辞和大家了。” 这一番话还算是谦逊得体,意料之中地迎来全场的掌声。 台下诸人又再分别向两人问了一些问题之后,会议的主要流程也算是走完。 除了公开询问的问题,不少人也有很多私下里才方便的问的事情要询问两人。 于是乎,在场的不少人就自然而然地分成了应用与理论两个派别。 一派以科技巨头,例如杰夫为首,围在孟繁岐周边讨论他出色成果的应用场景,市场潜力还有落地难点。 而另一派则以牛津大学的几位老学究为首,一群理论派,表情严肃,正在严谨地讨论一些设想和它们的理论证明。 以会场中心的走廊为分界线,一群人在左,一群人在右。 两人都没有想到大家会这么热情,勉强招架之余,不经意之间对上了一次视线。 而这个画面,则被一直在负责拍摄记录的摄影人员抓住了机会,使用专业相机拍摄了下来。 第90章 澳大利亚的企鹅 2013年末的这次国际计算机视觉大会有些黑色幽默。 最重磅的几项技术成果没有论文发表在上面,孟繁岐全投了来年的计算机视觉和模式识别大会,赛事研讨会也不在主会程里面。 副会远比主会人气要高,由于房间里位置不够,大会方优先让学界的人士进入了房间。 媒体方面的人能够进会场的就格外得少。 会程结束之后,孟繁岐等人都觉得有些疲倦,因此飞速地就从会场中溜走了。 门口揣着长枪短炮的记者们守株待兔了半天,直接就放走了最开始跟着其他人一起出来的这几位年轻人。 毕竟他们看起来是最不像需要自己拍摄,采访的人。 唯有几位做过功课的记者,对着孟繁岐一顿猛拍。 旁边有几位记者觉得奇怪,“你们拍什么呢?辛顿,罗斯,立昆他们都没出来呢。” “还在拍辛顿,罗斯,大家都看腻了。你知道刚刚过去的是谁吗?今年视觉领域称得上是突破的工作基本上全都是他一个人做的。” 什么水平,不关心时事也能出来当学术记者?连该拍谁都不知道。 这位记者一边回答,一边在内心嗤笑道。 要说这次会议中,后来传播最广的东西。 其实并不是孟繁岐又或者是韩辞的学术展示和问答,这种性质的东西真的会去看的人非常之少。 反而是那一张最后问答环节中被抓拍到的照片。 这张抓拍的照片以会场中央的过道为对称轴,首先天然地形成了一个不错的构图。 其中又有几大反差元素,比如年龄,国籍等。 照片的核心人物一男一女都很年轻,又都是华国人,与周边上了一些年纪的国外学者对比强烈。 两个人对上的视线,又使得原本割裂的画面两端产生了一些联系。 使得原本以学术为主基调的画面,萌生出了些许别样的含义。 不过照片中的两位主角,此时却不知道有这样的事情发生。 大老板终于了结了学术会议和谷歌合同这两件正事,其余的人这才好意思提出来要到处玩一玩。 “我想去看企鹅!企鹅好可爱!”麦芒喜爱各种可爱的动物,此刻早已按捺不住。 “扣分,扣分嗷。坏规矩了。”唐璜立刻指出麦芒的错误,“大老板还没有发话,你怎么敢的?” “企鹅不是南极才有吗?”孟繁岐不大懂动物,但他也没有什么特别想去的地方。 来到新的地方,看看当地的风土人情,动物也应该算其中一种。 “企鹅基本都在南半球,要说南极的话,澳大利亚和新西兰应该算是离得很近的了。我记得麦夸里岛上有好多小蓝企鹅。”韩辞的记性实在太好,看过的很多东西都忘不掉。 “小蓝企鹅是所有企鹅中最小的,小小的动物大都是可爱的,我们去看看。”韩辞也响应了麦芒的号召。 “去看看好了。”有关小蓝企鹅,孟繁岐倒是知道一段技术趣事。lux操作系统的创始人,林纳斯-托瓦兹就曾经在澳大利亚度假的时候被一只小蓝企鹅偷袭咬伤了。 这直接导致他选择了帝企鹅,也就是人们最熟知,第一时间会想到的那个企鹅形象作为lux操作系统的官方标志和吉祥物。 西尼野生动物园就在市中心,距离会场甚至没有2-3公里,这件事让众人还是相当意外的。 大家本都做好的长途跋涉的打算,却不曾想,出门散散步竟然就能够到达。 说是室内动物园,但却总体做得像公园。 里面的动物不是在吃就是在睡,甚是悠闲。 “哇,这只灰袋鼠好丑啊。”近距离看袋鼠,麦芒大呼小叫地,以貌取动物的她发现袋鼠远没有她想象的可爱之后,顿时十分嫌弃。 “你小心点,它的手臂上全是肌肉,当心它给你一拳。” 除了本土特色的袋鼠之外,考拉倒是相当可爱。 “考拉一生中八成的时间都在树上,一天超过十八个小时都在睡觉。这样的人生会不会有些无聊。”刘旭看了看旁边动物的介绍,有些感慨。 “那要么你算算我们学习和工作的时间?再算算我们睡觉的时间,看看还剩下多少?” “别说了,别说了,说多了都是泪。” 几人来得倒也算是时候,园方正好开放企鹅的近距离参观。 除了买点胡萝卜投喂长颈鹿之外,一行人得到了投喂一些小企鹅的机会。 饲养员将这一批大概十几人带入馆内后,热情地介绍道,“小蓝企鹅是世界上最小的企鹅,一般成年后也仅有40公分左右高。” “他们平时在这里栖息,在那边的池塘边吃饭。” 正在饲养员进行介绍的时候,有两只小蓝企鹅一摇一摆地从旁边路过,引起了游客们的低声惊呼。 “太可爱了。” “大摇大摆的,好得意的样子。” “这两只企鹅是我们动物园中的同性恋企鹅,他们两只都是雄性的。”饲养员非常尽职地介绍道。 旁边有一个来自苏格兰的白人小哥立刻兴奋了起来,“快告诉我一切,我要知道这两只企鹅的所有故事!” “我想请问大家,你们可以分得清雄性企鹅,和雌性企鹅吗?” 这一批游客迷茫地摇了摇头,随即又意识到了什么。 “很好,我想你们大概猜到了原因,不少企鹅其实也分不清。” “去年交配的季节,其他企鹅都开始做运动了,这两只企鹅也在做运动。可几个月过去了,其他企鹅都下蛋了,它们却下不出自己的蛋。” “于是它们两个整天在企鹅堆里晃来晃去,根本搞不清楚为什么事情会变成这样。” “最后,它们两个找了一块看起来像是蛋的石头,就把它搬回家里去了。它们会每天轮流一两个小时去孵这块石头。” 听到这里,游客们都发出心疼可怜它们的声音。 就在这时候,一只很小的企鹅跌跌撞撞地跟在后面,冲着它们赶了过去。 饲养员解释道,这是因为她从一只下了很多蛋的企鹅那里,拿走了一只蛋给这两只同性恋企鹅去孵化。 “嗷嗷~太可爱了。”几个女生听着这个故事,觉得非常的感人。 “可爱只是因为它们是企鹅。”孟繁岐对这样的事情完全免疫,“想象一下,把故事中的企鹅换成人类。” “闭嘴!!” 第91章 数据基建 会程结束后,一行人滞留西尼又游玩了几天,这段时间是难得的放松。 可惜欢乐的时光总是短暂的,除了孟繁岐和唐璜两位休了学的人,其他的四位仍旧有学业在读。 这次正常上课的时间,能和孟繁岐一同过来,已经是相当不容易了。 再拖延了几天,终究还得赶回学校,否则挂上三四科也不是没有可能。 孟繁岐有心提携身边人一把,但也不至于一路护送,让人本科也别念完,这个不现实。 这次带他们过来,主要是让他们见识了解一下ai界现在的情况和潜力。 准备继续留在国内的刘旭,麦芒和秦慧三人,孟繁岐自然是有着自己的安排和打算的。 他希望几人协助去做的最重要的事情,就是在国内建立一个优质中文数据库。 这个东西是未来中文chatgpt能够取得成功最最关键的因素。 孟繁岐有信心凭借自己的能力把西方ai界的资源尽数收入囊中,但他却解决不了中文优质数据不足的这个根本难题。 这也是重生前,困扰华国诸多科技公司的最大原因,优质的中文数据远少于英文。 而优质数据就是ai时代的石油。 华国互联网起步晚,数据积累逊色一些是一方面,一个个都忙着在赚快钱则是另一方面。 这种白白投钱进去,收集数据,标注数据的脏活累活谁肯做呢? 为了中文和华国ai在四五年后的chatgpt时代能够跟上节奏,这件事就只能由孟繁岐提前布局了。 这可是个黑洞一般吞噬金钱的大工程,一位员工的使用成本,一年少说就得十万块,招百来个人,一年过去就是数千万。 收获得只有一堆堆无情的数据,这件事情短期内不会有任何的营收。 四五年的长线,孟繁岐少说得砸个亿进去,如果想要数据的质量和规模上精益求精,十几个亿进去也不是没可能。 “还好跟谷歌欠了分成合约,否则真不知道哪里去弄这些钱。” 孟繁岐感到了些许的压力,仔细计算了几笔账之后,他意识到自己想做的事情成本似乎远高于自己的想象。 给谷歌的推荐广告算法更新得尽快提上日程了。 “刘旭,麦芒,慧慧,情况大概就是这个样子。三四个月后,我会跟你们具体再联络,你们先负责帮我在国内弄好数据收集这件事情。” 机场,孟繁岐和唐璜要去一趟尚海,其余人则都是回燕京。 此次一别,以后见面的机会不会太多,因此孟繁岐交代了一下后面的大概计划,“这个数据收集的任务,你们不需要考虑营收的事情,不要有压力。这个公司办出来就不为了赚一分钱,所有的支出我会负担,工资肯定不会少了你们的。” 让这几位同学先帮助自己打理一下数据的收集事宜,孟繁岐签了谷歌的大单,白度这里的分成就不准备再往美国去转了。 就留在燕京,投进去把中文数据的基建给做做好,不要做个绘图还得转成英文,闹出什么松鼠鳜鱼,胸有成竹之类的笑话。 “先做好数据的基建,等以后有了其他机会,我再跟你们细聊。” 这个数据公司肯定会和白度有些合作,孟繁岐准备借助自己的关系,从白度内部多搞点数据出来。 等他们几个和白度之间来来往往,先锻炼锻炼,明年有其他和国内大厂技术合作的机会和任务再交给他们承担一些也不迟。 当然技术方面肯定会由孟繁岐全权负责。 主要还是这笔数据由熟悉的人去负责打理会比较放心。 “那有机会来斯坦福交流呗。”韩辞前几天并没有给李飞飞一个确定的答复,孟繁岐也不清楚她是怎么想的。 按理说,燕京大学和鄂院士在国内的咖位够大了,但韩辞很清楚,在应数的圈子里做ai和统计,是绝对没有跟着ai新时代的领军人物孟繁岐的脚步,做ai理论和ai解释性划算的。 光是前两天展示的那个排场,没有孟繁岐的实际性能突破在先,这点数理证明绝对是无人问津,门可罗雀的。 不过她此时思绪很乱,完全还没有想明白这件事。 孟繁岐也没有多说什么,他相信也尊重韩辞自己的想法。 不多时,他与唐璜先登上了回国的航班。 这趟过来,除了孟繁岐与韩辞在ai学界声名大噪之外,其余四人当中收获最大是唐璜。剩下三人只是逛逛,见了见世面。 作为当时孟繁岐赛时实验设备的赞助者,也作为前世引导孟繁岐走上ai道路的人,虽然混了一点,唐璜却还是有资格将名字挂在参赛队伍中。 而这也同样为他赢得了入学斯坦福的门票,即便没有全奖和直博的好待遇,斯坦福这所学校的档次也远胜过他原本计划申请的那些学校。 有一个知根知底的朋友在身边,别的不说,以后不少不大方便的事情都可以放心地交给他去办。 况且唐璜在不少方面还是有些特长的,或者说也不算是特长。 比如熟悉二次元在任何时候似乎都说不上是什么优势。 除了这次专程前去尚海收割米忽悠一波股份之外,孟繁岐实在也想不出唐璜的这个属性还有什么用了。 虽然米忽悠此时仍旧没有任何成功的迹象,可实际上这家只有几个人的工作室已经成立了接近三年的时间了。 在11年初的时候,尚海交大的一间宿舍内,几个还在读的学生成立了米忽悠工作室。 谁也没能想到,这家以二次元为主的游戏公司后来能够凭借两三款游戏直接冲到2000亿元的估值。 在新世纪所有起飞的互联网类公司当中,米忽悠的独树一帜还不仅仅在于此。 最传奇的部分在于,这家公司从始至终,都只接受过一次融资。 大家都经常看到类似这样的新闻,某公司获得b轮融资,估值上百亿。 之所以融资,其实就是做事情缺钱。就如现在三位每个月领4000元工资的米忽悠创始人一样。 天使轮、a轮、b轮、c轮、d轮融资,指得其实就是指融资的顺序。 越到后面,公司的产品,盈利方式,规模等方面都越成熟,风险越小。想要取得同等股份,需要投入的资金也就越大。 寻常公司想要做大上市,融个四五轮都是非常寻常的事情,融资的规模几个亿都不算大。 而米忽悠从11年底到12年,辗转了一年多的时间,却一笔投资都没有拉到。 由于三位创始人均为尚海交大科班成员,其实有许多投资人曾经对米忽悠起过兴趣。 只可惜,二次元文化别说在当时,时至今日也难以算得上是市场主流。 尤其三位创始人浓度过高,成分很成问题。 第92章 黎明时分 从后来米忽悠的官网,什么‘技术宅拯救世界’,就可以看出老一辈资本持有人是承受不住这个强度的。 唯有sk网络的宋涛,在2012年主动致电,用100万换来了米忽悠百分之15的股份,这部分股权在十年后价值200亿。 这得是什么概念,200亿就算百分之2的利率去存银行,一天的利息都不止一百万了。 米忽悠此后便再也没有其他的融资记录。 没有钱的日子不好过,可融了资的日子未必就能好到哪里去。 米忽悠今年上线的《崩坏学院》只能说反响平平,没什么太大起色。 没有融资的时候可以不赚钱,大家都是穷哥们,一起凑合凑合把日子过了,就算是西北风也张开嘴狠狠往肚子里咽。 拿了投资人的钱之后,这可就不行了。 想让股东喝西北风,股东怎么也得扒你一层皮。 三位创始人,蔡浩雨,罗雨皓还有刘玮,如今个个都是多面手。 拿着税前4000的工资,一个人至少干着四个岗位的活,看不清未来的道路和方向。 就在前几天,刘玮与蔡浩雨等几人还在讨论呢,这日子算是过不下去了,几乎是山穷水尽。 再有两个月,米忽悠孤注一掷的《崩坏学院2》就上线了,从单机的崩坏一改为网游的模式。 这回如果再要是一潭死水,又找不到新的融资,干到14年底弟兄们也就只能散了。 而后的事情就不是什么秘密了,14年1月底上线的崩坏2逆转了颓势。 当年的收入就超过亿元。 米忽悠乘胜追击,继续推出了崩坏3和原神,并凭借这两款游戏的离谱收入,直接摆脱了融资需求。 融资?拜托,手里的现金多到不知道放在哪好吗。 此时的米忽悠正处于黎明时分,天亮前最后的黑暗当中。 孟繁岐对这件事还是相当庆幸的,自己的动作如果再慢一些,等到两个月后崩坏二上线且有所起色之后,价格就不可同日而语了。 不过,米忽悠的三位也不是谁的钱都愿意拿。 如果有选择的话,他们更希望能够控制绝对数量的股权。 这个情况一直被保留到了十年后,直至2023年,以蔡浩雨(41的股权)为首的三人仍旧掌握着公司超过八成的股份。 就连企鹅系只求股份,绝不参与其他任何管理决策的投资要求,都被直接拒之门外。 或许再早几个月,在崩坏2还未成型的时间点,会更容易谈下更多的股份。 现在的话,就很需要唐璜对二次元的熟悉来谈下这笔生意了。 别的不说,现在在米忽悠有话语权的高层,全都是新世纪福音战士的骨灰级粉丝。 在创始人三人组中有着核心地位的蔡浩雨更是经常穿着新世纪福音战士的周边服饰去公司工作。 接到这个任务的唐璜有些不明白,自己为什么要去跟几个陌生人去聊新世纪福音战士。 但经历了这几个月魔幻人生的唐璜,已经对孟繁岐的决策没有任何反对的能力,甚至连质疑的想法都无法升起。 “不过,只是聊这些二次元内容还是不大够。”孟繁岐一边说着,一边在纸上飞速地写着些什么,“这次的投资,我希望由你来主导,通过你对二次元的熟悉跟对方拉进距离。” “最终目的是投资的话,只是不痛不痒地聊一些什么一定是不够的。所以这些内容你可得背熟了,到时候没聊下来,我可拿你是问。” 孟繁岐知道米忽悠方面最为担心的就是资本分走股份后会影响他们对公司和游戏路线的决策。 因为他们坚持二次元游戏的道路,已经被资本拒绝和打击太多次。 从内心深处,他们已经不信任资本,不认为资本会真的看好他们想做的二次元。 当然了,此时的孟繁岐手头的那小几千万,说是资本实在有些太抬举他了。 可分走的股权却是实实在在的,孟繁岐此行的目标是35-45左右的股份。 宋涛是在去年一百万分走了15的股份没错,但今非昔比,孟繁岐现在想以1500-1800万的价格拿下40以上的股份,难度还是相当之高的。 非常之事,当然要行非常手段。 孟繁岐认为,以三位创始人的尿性,由一个非常熟悉二次元的人来主导,绝对会谈下更多比例的股份。 “他们还做过泡泡堂?这游戏我也玩过啊!”唐璜在阅读孟繁岐写下的蔡浩雨几人的大概经历,不禁惊奇道。“泡泡堂我印象中是很爆款的产品,他们现在日子怎么会这么难过?” “盛大想收购,没同意呗。他们当时做的应该算是泡泡堂的前身,并不完全是后来那个大火的产品。” 落地到机场之后,唐璜把米忽悠之前推出的几款游戏都下载下来看了一下。 “《fly to the oon》,这浓度可不低啊。”唐璜当然一眼就看出,这款米忽悠11年出品的美少女打怪吃豆游戏,与新世纪福音战士的片尾曲同名。 唐璜又把《崩坏学院》下下来玩了一会,算是彻底知道自己需要干的是什么活了,“好家伙,美少女打美少女僵尸的游戏是,这目标用户算是够明确的,阿宅嘛。” 从严格意义上讲,唐璜称不上是二次元和宅男,他只是热爱电脑,热衷于了解各种亚文化。 “都说拒绝黄赌毒,真要说起来,这三样东西来钱是最快的。”唐璜一眼就看出了这系列游戏的最终运营模式,就是二次元软涩情加抽卡。“这种游戏搞买断真没什么前途,不如各种换装加盲盒。” 旁边孟繁岐听了这话,差点把自己大腿给拍断了。 这小子牛啊,把后来这类游戏的核心卖点总结得是清清楚楚。 “这就是游戏的厉害之处了,咱们的游戏玩家也不知道是怎么搞的,一款6块10块的买断游戏,嫌贵。上线游戏,648抽两个皮肤,充起钱来眼都不眨一下的。”孟繁岐很想不明白,传奇页游,是兄弟就来砍我疯狂营收,3a大作动不动就卖的不好。 “这你就不懂了,绝大多数时候,人们在做出决定的时候其实是不过脑子的。”唐璜说起这些东西来,那是摇头晃脑,头头是道。 “你先骗他进来玩,然后想办法让他用别的身体器官思考,还由得你648不充?”唐璜嘿嘿笑道,“游玩前付款是一个理性决策,游玩中充值则是收到本能或者欲望的驱使,你得把他的馋虫给勾出来,这叫请君入瓮。” 第93章 君不邀我自来也 尚海是座不错的城市,唐璜前世后来在此落脚,掏空了家里的几个钱包背上了数十年的贷款。 孟繁岐也在这里奔波过几年,在两三个大厂之间流连忘返。 如果说最让他觉得舒服的一点,就是这里的生活稍微有点距离感,又或者说是冷漠。 不论实际上是哪种其实都不要紧,他只是更加喜欢平静安稳的生活,讨厌无聊繁琐的迎来送往。 大家都过好自己的生活,不要总是对别人的个人事情指指点点,这样也挺好的。 或许有些人会觉得无情,可孟繁岐本就不相信人与人之间会真的相互理解,真的为对方好。 更多的人,希望你好,但最好不要比他过得更好。 如此一来,看待过得比自己差的人多少带点优越,看待过得比自己好的人,又容易带点嫉妒。 不论事情如何变换,折磨永恒。 既然这样,还不如干脆不要多管不要多问。 举一个眼前的例子来说,米忽悠2012年的时候,除了蔡浩雨占股较大,达到41之外。 还有一位刑同学,与罗宇皓,刘玮两人共分余下的股份。 不过公司创立一个月之后,刑同学便因为自己拿到了国际大公司,思科的录用,因此离开了初创团队。 这百分之13的股权,一万三千块转让给了罗宇皓和刘玮。 国际大厂打工,虽说安稳,这辈子大富大贵确实是指望不上了。 在思科这样的地方,养老倒是不错,只是不知道刑同学多年之后,会不会总是无法忘怀自己曾经以一万三千的价格出掉了十年后价值二百多亿的股份。 孟繁岐觉得,没有必要马后炮地去嘲笑刑同学。 如果不是生活所迫,谁会乐意去当一个打工仔呢? 离开的背后想来一定是一个非常艰难的决定,就米忽悠目前的情况来看,这样的决策也无可厚非。 孟繁岐和唐璜来到徐会区米忽悠办公地点的时候,米忽悠初创的七人团队有六个人都在。 三位创始人均奋斗在第一线。 六人之中,有三人头发乱蓬蓬地,穿着非常符合程序员刻板印象的格子衬衫。 其余三人当中,刘玮穿着颇为正式,孟繁岐知道这是因为大伟哥主要负责对外的交流。 绝对核心的蔡浩雨,穿着一件灰色的毛衣,面色不佳,有些黑眼圈。 不过眼神还是颇为坚毅。 两人登门造访,事先通过一个简短的电话,因而几人知道今天有天使投资人。 只是完全也料想不到,两位投资人的年龄看上去比他们还要小上五六岁至少。 作为创业者,87年的蔡浩雨今年26岁的年纪,在这个圈子里已经可以算得上是相当年少。 而这两位声称要对自己公司进行注资的年轻人,竟然还要明显更小不少。 不过,这也同时让他们产生了一些信心,看来自己几人的路线,虽然得不到那些中老年资本的青睐,还是可以打动年轻人的嘛! “不知道两位是怎么注意到我们米忽悠的呢?”米忽悠的三位创始人向来是自己跑出去求人投资,确实是没有想到会有投资人登门拜访。 而孟繁岐两人落地通完话,直接便赶到公司来了,没有留给他们什么准备的时间。 眼下就连椅子都不够用,挪了两把破旧的工作椅过来之后,有一位员工不得不站着等待。 “我注意到你们公司,主要还是因为你们有一款游戏《fly to the oon》和我喜爱的动漫片尾曲同名。”孟繁岐在一旁毫无反应,唐璜瞬间知道自己该开始忽悠了。 话刚说到这里,蔡浩雨已经按捺不住,面露喜色地与其他两位创始人交换了一下眼神。 实在也不是他沉不住气,求人投资一年多,投资人向来都是一听二次元的东西就把头摇成拨浪鼓。 恨不得他们马上做一箩筐热血传奇页游去圈钱。 别说是投资人懂二次元,投资人能有耐心在听到二次元三个字之后,继续听他们说话就不错了。 “我觉得宅男跟其它群体有很大的区别,他们的忠诚度很高,你做出一个很好的产品,他们一定会追着你的,像我们每天追着新放出来的动漫一样,真正把产品做好,他们的忠诚度、每个人付费欲望会很强的。” 蔡浩雨接过话头,介绍着自己的目标客户和逻辑。 “但我看你们的崩坏 1不太赚钱啊,好像也没有获得广泛的用户的认可。”孟繁岐欲擒故纵,以退为进。 他让唐璜来扮演一个熟悉,热爱二次元的投资人,自己站在一个次要地位上适时地稍微唱唱黑脸。 “但崩坏 1的流水已经超过两百万,我们其实实现了初步的盈利。”蔡浩雨这里稍微玩了一个文字游戏,两百万的流水撑死了是平了账,能有一丁点的进项就不错了。 盈利是一毛钱也是盈利。 要是真盈利很多,几位初创人员何必要给自己开4000的工资呢? 这时间他们任何一个同学毕业之后去找工作,都能够拿到比这个数远高的,可能是一万多,可能是两万多的工资。 “2013年经历了历代游戏的不成功,让我们认清了我们想要做什么——我们想要一个成功的商业产品。我们新一代的崩坏二,两个月后计划上线,我们预期会比第一代产品多赚十倍,营收超过2000万!” 蔡浩雨这句话倒没有吹牛,崩坏二别说是十倍了,实际营收超过了百倍。 “我还是相当看好国产原创二次元游戏的未来的。”唐璜尽职尽责,“你不了解二次元可能不明白,国内在这方面有很大的空白,你还信不过我吗?你不投我可要自己投了。” “我倒不是质疑你的眼光,我单纯觉得,目前最大的障碍是智能机还没有得到足够的普及。”孟繁岐稍微放缓了点态度,并给了米忽悠一方说服自己的一个切入口。 对于融资方面来说,来自个人的总比来自资本的好,来自年轻人的总比来自中老年人的好。 纵观所有接触过的投资人,蔡浩雨三人实在想不出还有什么更好的情况了。 眼看着孟繁岐稍微松了口,顿时都使上了浑身解数。 第94章 入股米忽悠 “智能手机发展迅猛飞速,预计最多一两年内,一定会有突破。” “移动端的崛起是一个很好的切入点,单机游戏在很多时候非常不便。” “我们有技术、美术等等方面的优势,可以从移动游戏切入,建立起粉丝基础后,树立虚拟偶像,然后围绕ip拓展周边如互动媒体、在线文学、数字音乐等等” “设备的下沉,联络的便利实际上会加深人自己寂寞和孤独的情绪,我们的目标就是为这些孤独的灵魂提供栖息的场所。” 三人连番上阵,越吹是越玄乎。 这也合理,毕竟他们前年是要跟卖绿壳鸡蛋的农业公司,以及研发静脉留置通路封管的医疗公司一起竞争创业基金的。 要是牛皮吹不好,他们连最初的那十万块启动资金都弄不来。 “老孟,你放心,他们做游戏是有细节,有情怀的。我相信他们一定可以出成绩。”唐璜入戏很深,已经开始跟三位创始人穿一条裤子,跑来‘劝’孟繁岐了。 这让蔡浩雨等三人感觉如梦似幻,同时也觉得有些蹊跷。 但看孟繁岐犹犹豫豫的样子,又觉得情有可原。 蔡浩雨等三人环顾了一下自己如今屁大点地方的小工作间,一穷二白,实在也想不出对方能有什么等着坑自己的地方。 “你们让我好好考虑十分钟。”孟繁岐再次放缓了态度,一个人踱步出去。 以蔡浩雨三人的感触,今天的这次投资似乎并非是自己预想的来自于一个资本。 而是来自于两位卓有家底的年轻人,并且似乎是眼前的这位唐璜,硬拉着孟繁岐前来的。 “孟繁岐,这名字怎么好像在哪里听说过?”刘玮看过一部分白度的发布会,但是没有太过仔细。 方才开始就隐隐约约地觉得哪里不对,这人怎么好像在哪里见过? “就是给白度提供检测核心技术的那个。”唐璜抓住机会,果断开吹,“我们其实都是同行,都是程序员嘛,只不过我们两个是写ai算法的,你们是写游戏的。” “他独立给白度提供了世界级的突破,现在分红到手里,钱太多,没地方花了。来问我投资点什么好,我就给他拉来了。” 一听原来两位同是程序员,蔡浩雨和刘玮几人顿时觉得两人又变亲切了不少。 与唐璜聊了一些二次元和米忽悠之前游戏的内容,唐璜都对答如流,蔡浩雨等人彻底消除了戒心。 “我这点钱还是其次,如果你们真的可以争取到孟繁岐的入股,对你们以后往海外发展的计划也是大有好处的。”唐璜说着,把手机掏出来给三人看了几张照片。 其中好几张,都是孟繁岐与杰夫交流时拍下的照片。 同时,也不乏一些微软,ib高层在国际计算机视觉大会上与孟繁岐交流时的照片。 辛顿的影响力比较垂直辐射,是ai这一领域中的教父级人物,而杰夫的影响力则更为广阔。 比如蔡浩雨等做游戏开发的程序员,就从未听说过辛顿,但却一眼就认出了杰夫这位站在程序员序列顶峰的男人。 “杰夫-迪恩?那个写了大规模数据处理系统和分布式存储系统的谷歌传奇工程师?” “卧槽?他和杰夫是什么关系?” “听说和杰夫吃一顿饭,代码速度至少提升三倍。” “他已经签了谷歌大脑,前几天才跟杰夫签的合同。”唐璜这里倒不需要添油加醋什么,“杰夫亲自去澳大利亚跟他谈的合同,三千万美金签字费愣是没签。” “光是签字费就三千万美金?还不签?”蔡浩雨三人听完人都麻了,他们几个怎么说也是尚海交大的。 从小都算是计算机方面的天之骄子,09年三人合体参加中科院计算所的技术创新大赛,还获奖拿了几十万的奖学金。 算算当时的年龄,也就和现在的孟繁岐差不多。 结果呢,人家这个年纪直接跑去和谷歌的杰夫谈合同去了,签字就到手的两亿元硬是不要。 “那最后是怎么签的?”刘玮对这件事很是好奇。 “技术分成嘛,按技术的影响力和带来的收益分成。”唐璜这时候还不忘和三人拉进距离,“其实跟你们的经历类似,有赚传奇页游,三国游戏圈钱的机会,但是没去。坚信自己的技术和想法有更大的价值。” 蔡浩雨三人听完甚是感动,心说我去,原来我们这么厉害吗?之前怎么没觉得? 被他说得自己都有点感动了。 “我决定投资的最主要原因还是你们有自己的坚持,没有去做变现快的页游。”孟繁岐回来之后也不再墨迹,他觉得犹豫演个两轮差不多了,再继续下去有些做作。 “我的领域也是如此,大家都在钻营马上可以变现的技术,真正肯沉下心来搞突破的人可以说是寥寥无几。”孟繁岐盯着蔡浩雨的眼睛说道,他知道谁才是公司的绝对核心。 “我愿意相信坚持自己技术想法的人,我们谈一谈份额。” “目前为止,我们只有一位天使投资人,占比百分之十五,余下的股权都在我们三人手中。”蔡浩雨一上来就先说明了自己的底线。 “总得来说,我们三个人至少需要保有公司百分之51的有效股权,同时,如果进行融资的话,我们需要投资者签署协议。在他们的股权发生转让的时候,我们三人有绝对优先的回购权利。” 这两件事的核心就是蔡浩雨希望创始三人组始终能够保持对公司发展路线的控制力,这两点孟繁岐都没什么意见。 “没问题。这样如何,你们保有公司百分之51的原始股,那位天使投资人按同比例稀释为百分之9,我们两个人分别持有米忽悠的百分之二十,但我的部分只需要分红权,具体的决策权则由蔡总代理,这样的比例,你们开个价。” 孟繁岐的刀法算是非常精准,一刀切在了蔡浩雨最要害的位置。 虽然说分红的比例由于融资,自己三人从85降低为51,但决策权的部分,则只从85降低为71。甚至还不如上次融资减少得多。 原来创始人是以41+22+22比例,去分百分之85的决策权,现在则变为 25(+20)+ 13 + 13。 蔡浩雨的决策权占比不降低反升,同时和原本一样,他只需要联合任一一位股东,决策权占比就能够超过50。 第95章 紧急求援 而除了蔡浩雨之外的两人,股份则变化回到那位刑同学离开之前。 无非是将共计一万三从刑同学那里买来,两个人平分的股份,如今再高价卖出罢了。 他们二人其实是没有太大损失感的。 原本就是13左右的股权,如今一年半过去,当初花六千五收的部分现在可以去融上千万。 在眼下这个比较困难的时期,两位创始人已经心满意足了。 出血最多的还是蔡浩雨,他的分红权利要从41直线下滑到25,不过实际的决策权利不降反升。 仍旧处于绝对的优势地位。 “实话实说,按照原本的想法,我是坚决不会同意放出这么多股份的。”蔡浩雨心目中,自己和其他两位创始人一起掌握至少51的股份是底线不错,但这个底线也不是谁来都能谈得下来的。 “但有几件事情,让我觉得这个情况可以接受。一是你们都不是纯正的资本,而是跟我们有同样经历的程序员,有自己的事业;二是其中你的两成是虚拟股,只需要分红的部分;三是唐璜他的理念和对我们路线的理解,让我觉得可以放心。” “我个人还是希望把出让的股份控制在百分之30以内,融资可以少融一点,如果你们坚持要控股百分之40的话,价钱只是一方面,我希望可以借助你的技术关系和白度以及谷歌有所联系。” 孟繁岐闻言了然,“你的想法我完全理解,这个不是什么难事,我们可以写在合同当中,如果未能履行承诺,你们可以原价回购这部分股权,即便它们的价值已经发生了变化。” “白度,尤其是谷歌可是世界级的巨无霸公司,你确定我们明年迟些时候有海外发行需求的时候,你能够做得了主?” 刘玮倒也不是故意要怀疑什么,他刚刚检索了一下,知道孟繁岐的技术水平不得了。但一个技术人员,尤其是ai算法技术人员,真的能把手伸到游戏,或者谷歌app平台乃至宣传广告那些部门去吗? 这都是不沾边的部门啊 唯有孟繁岐清楚,等过几周,自己提交一版本新的推荐算法之后,谷歌14年第一季度的纯利润说不定就要增加十几二十个百分点。 单季度就能创收几十亿美金。 在谷歌占据8成的核心收益版块里搞了革命,谷歌董事会的人还不把他视若掌上明珠? 看在他的面子上,给一家游戏公司上几个渠道,打两个广告算得了什么?都是一家人,太见外了。 国外有谷歌,国内有白度,可以说搜索引擎这一块已经稳稳拿下了。 这对日后产品的宣发推广的重要性是不言而喻的。 四处寻求投资的米忽悠自然早就准备好了现成的合同条款。 而随着这部分的条款写入其中,蔡浩雨最终以一千五百万的价格对公司的股权做了重新的调整,出让了百分之40的比重。 对比11年的十万,12年的一百万,每年的进项以十倍的速度持续增长,总得来说还是乐观的。 孟繁岐心满意足地收起了合同,比起明年从谷歌分得的收益,这一千来万已经不算多,自己后面的计划不差这一点钱。 若是直接用于投资,得反反复复交易多少次,才能让它变成几年后的接近一千亿呢? 其实此时还有一些其他公司在起步阶段,比如孟繁岐重生前曾经任职的比特跳动,又或者是喜马拉雅,小红书等等。 不过比特跳动和喜马拉雅此时都已经融过一两轮,想要入局少说得大几千万,孟繁岐手头暂时没有那么多钱。 而小红书虽然和米忽悠一样处于初始阶段,可它后续融资轮数多且复杂,远不如米忽悠的情况纯粹好掌握。 避开那些资本和基金,能省去不少烦心事。 重生回到十几年前,拿着几十万一百万就买断某个后来的科技巨头大笔的股份,然后变成百亿富翁,这个想法其实稍微有一些天真了。 这些科技公司融资的过程步步惊心,十分繁复,其中可以操作的地方还有手段实在太多。 米忽悠的唯一投资人宋涛也不是什么无名之辈,他的sk网络成立于05年,是华国第一家在美上市的移动互联网公司,旗下的平台冒泡累积用户十数亿。 米忽悠初期的几款游戏,都得到了这个平台的支持。 如果只能单纯提供一丁点资金,却没有其他的人脉和影响力的话,在公司日益起飞的同时,是很难真的拿得住那些股份的。 其中门道可以说非常繁复,公司章程里之所以需要规定详细的分红方式和分红时间,大股东的工资奖金占比还有借款流程,就是为了限制占据50+股份的大股东借故排挤小股东。 逼迫小股东出手股份,又或者干脆通过种种方式转移公司的核心资产,进而将小股东手里的股份化为废纸。 像小红书这种多轮融资的复杂情况,早期还好,过几年势头起来之后,如果股东除了当年的一千万之外没什么其他能力和资源的话,股权基本是很难拿稳到2023年那么后面的。 不过这就不是孟繁岐需要担心的事情了,虽然基本不准备自己创业,但单凭技术入股和收购米忽悠这样类型的投资操作,孟繁岐的资产和身价在一年之内就将迎来百亿元级别的飞跃。 就在签署合同之后,几人还在就公司的未来和路线进行交流讨论的时候,孟繁岐的电话突然响起,刘玮和蔡浩雨瞄了一眼,上面李彦弘三个大字顿时让他们心神大定。 就冲这电话直联的情况来看,他在白度的地位肯定不一般啊。 这通电话实际上并不是巧合,又或者是刻意的安排。 李彦弘在7号孟繁岐的会议展示之后,这几天的时间已经连续给孟繁岐打了十几个电话了。 李彦弘以为孟繁岐会很快回国,却没想到几人又滞留澳洲游玩了几天,因此电话始终打不通。 今天孟繁岐刚刚落地没几个小时,李彦弘便又有电话进来。 “好家伙,你小子可算是回来了。”有了上次拍摄和预支分成的事情,李彦弘与孟繁岐的关系更显得亲近了一些,“最近有没有空?跟政府的项目就指望你救火呢!” 孟繁岐稍有些故意地把声音开大了一些,没有外放,但有心人还是能够大概听得分明。 蔡浩雨三人面面相觑,发觉自己似乎还是远远低估了孟繁岐对于白度的重要性。 第96章 这个很好做啊 “救火?发生什么事情了。”孟繁岐有些惊讶,自己给出的yolo版本已经是相当成熟的版本。 就连具体一些算子操作的兼容性都考虑了进去,不应当有什么问题才对。 而李彦弘稍加解释之后,孟繁岐这才恍然大悟,自己还是低估了时代对于视野的限制。 根据李彦弘的信息,目前阶段,白度已经和一些偏政府性质的机构签订了项目合同。 比如燕京的水文总站,他们希望有十几二十个摄像设备搭配白度最新的检测算法,并搭配白度的语音检测技术。 主要希望的功能就是实时检测监控区域的鸟类和它们的品种,并只存储具有鸟类的视频画面。 提升检测精度,扩大检测范围,细分具体种类,并提供对外的功能,让社会公众可以轻松地检索到对应品种的鸟类视频去观看。 这个项目非常小,难度也很低,只需要收集对应的鸟类数据,用孟繁岐提供的代码直接就可以做。 “李总,透露下,这个项目签了多少钱?”孟繁岐不大了解官方在这方面的投入,故有此问。 “哈哈哈哈。”李彦弘爽朗地笑了出声,然后轻声答道,“差不多三四百个。” “三四百个???”孟繁岐直接控制不住自己的音量,惊呼出声。 这钱是真特么敢收啊,这个需求孟繁岐提供的代码直接就能做,连改都不用改,技术和软件方面几乎0成本。 就连人力,一两个人忙几天最最多了。 唯一的成本就出在摄像头设备上,但水文站本身就有一些。 即便一个都没有,全给他配上高清摄像头能用几个钱?就是全给他装单反,也花不到四五十万。 “我的想象力还是远远不够啊”孟繁岐惊叹于其中的利润。 而李彦弘则急于询问那几个政府急需,白度却怎么也做不出来的需求。 这个事情原本只是一个难题,那就是道路上的车辆多目标跟踪,如何确定视频中不同帧上的车辆哪些是同一辆。 这本就是目前没有很好解决办法的技术难题,又要在孟繁岐刚刚给出不久的yolo源码上进行开发。 这对目前的白度来说,本身就不大可能做到,更何况不少技术人员都跑出去推销产品去了。 而随着一些简单项目的成功展示,政府方面在毫不知情的情况下,又有了其他的需求和想法。 比如超速车辆的车牌自动记录,那你就要在能够做到多目标跟踪的情况下,还要把异常车辆的车牌智能提取出来,并对这个部分做智能文字和数字识别。 这就又涉及到特定区域内文字信息的识别和理解。 说到这里,李彦弘迟迟没有得到孟繁岐的回应,还以为是手机信号不好。 “喂?喂??听得见吗?” “听得见,我在等李总说遇到的难题呢。”孟繁岐觉得有些奇怪,怎么李彦弘说了半天也没说到困难的部分,现在白度的ceo都这么闲了吗?说话都没有重点。 “” 李彦弘闻言当场语塞,有些不大确定孟繁岐的理解到底和自己是不是相同的。 “最核心的就是多目标跟踪嘛,在事先不知道目标数量的情况下,对视频中的多个车辆目标进行检测并赋予标记进行轨迹跟踪,不同的目标拥有不同的标记。” 孟繁岐总结了一下最要紧的需求,李彦弘连连称是。 “这不是挺简单的嘛。”孟繁岐私下一般不装,但在刚刚签下合同的米忽悠三位创始人面前多少还是有点包袱,小小地卖弄了一下。 “用卡尔曼滤波加匈牙利算法就好。基于yolo先去提取图像特征和检测结果,匈牙利算法寻找二分图的最大匹配,卡尔曼滤波控制轨迹,进行预测。” “你能写吗?”李彦弘之前只知道孟繁岐技术研究厉害,还没有领教过他解决这种实际问题的能力。“大概需要多久?” 在内心深处,李彦弘有些狐疑,说怎么做很多人都会说,可轮到自己真的上手,能不能解决问题那就不好说了。 这完全是两个领域的能力,李彦弘对孟繁岐的个人能力毫无质疑的意思,坚信他大概率可以解决这个问题,但他完全没有料到会这么快。 问题的解决办法,孟繁岐完全是脱口而出,就如本能一般。 仿佛解决这个困扰了白度技术团队一两周,进展几乎为0的大难题就如同喝水一般简单而自然。 “两三天,怎么了?”在孟繁岐看来,检测相关的几个任务变种属实没什么难度,重生前类似的业务都写腻了。 “额方便帮我们开发一下吗?”西尼的事情李彦弘也有所耳闻,知道孟繁岐如今已经签约了谷歌。 只是不知道具体的约定内容,此时开口,颇有点强人所难的味道。 “方便的,谷歌给我开的基本工资并不高,主要还是依靠技术分成。其实也没有禁止我私人出去创业什么的,只不过对我作为创业核心的公司有优先收购权。” 由于没有天价的签字费,谷歌便也没有对太多限制孟繁岐的细则。 你不给我技术就不分钱呗,天底下还有几个比谷歌更好的平台呢。 “李总,用什么方法我刚刚直接都说了,这个面子只给你。”孟繁岐其实反而没有那么想要接这个任务。 基于yolo的东西他都能抽成,没必要一个个需求去帮白度做,眼下这一两个月把谷歌的推荐广告算法做好才是正道。 “唉呀,这不是时间赶得紧嘛,政府那边你也知道的,要是换了别的客户,我肯定不来打扰你。”孟繁岐说了核心做法,李彦弘相信自己研究院的人可以做出。 可具体要多久,过程中有没有问题那就不好说了,到时候说不定还要连续麻烦孟繁岐好几次。 既然没有把握,肯定还是让这位ai天才出手来得稳妥。 “李总啊,不要怪我说话不好听,思路已经讲了,如果还是非要我来写的话,我们要在商言商,那就是额外的价钱了。”孟繁岐和李彦弘的合作目前为止还算愉快,给一点思路和提示没问题,不过还远没有到打白工的地步。 “这是哪里的话,怎么会让你白做?”急事求人,李彦弘自然不会吝啬,“如果几天内真的可以搞定,这个政府项目单独再给你加一成的抽成。” “一言为定。” 钱送到脸上来不赚还不行了,孟繁岐有些没有想到。 第97章 哥,能带我走吗? 根据合约,基于yolo算法的项目收益孟繁岐本来就能持续抽两成,再加一成确实是不少了,已经接近三分之一。 尤其是政府项目,需要投入的人力不少,各方面的章程也较为复杂。 “不过李总,我现在人在尚海,手边也没有设备,这个恐怕得你们尚海分部稍微准备一下了。”尚海的白度分部吗?孟繁岐情绪复杂地笑了一下,这算不算某种意义上的故地重游? “尚海?怎么跑到那边去了?”李彦弘先是不解,旋即恍然,孟繁岐本就不是燕京人,如今学业和工作都转移向硅谷,一直待在燕京反而很奇怪。 “来尚海,跟朋友一起投了家游戏公司,人还没走呢,要说这件事,以后有机会还得请李总关照一下,替我们打打广告。” 这充其量只能算是场面话,不过仍旧让米忽悠的三位创始人信心大增。 “没问题,这个绝对没问题。只要这个政府项目签得下来,白度游戏推荐的那些栏位,根本不叫事。”李彦弘相当分得清主次。 此时的白度已经在田林路科技绿洲有了尚海分公司,这个地址也是重生前孟繁岐曾经工作过的。 距离米忽悠的地址也不算远,大约两站地铁。 李彦弘承诺晚些时候让那边把东西都准备好,孟繁岐便答应下来,明天开始花两三天时间帮助白度把政府项目中遇到的一些难题和需求都解决一下。 从个人的角度来说,孟繁岐认为白度自己是有这个实力和能力把这些问题解决好的。 只是实时检测算法的突破和落地价值,使得李彦弘太过急于证明自己在ai方向的选择是正确的,明智的。 过多的注意力放在了洽谈项目,做项目需求业务需求上,专业人员缺乏足够的时间和精力去将孟繁岐方法的内在原理给吃透。 短时间内自然无法给出解决方案。 刚才孟繁岐已经点出了后来几个主流好用办法中的一个,那就是16-17年的rt算法。 采用的是在线跟踪的方式,不使用未来帧的信息,可以在较高的fps下运作,非常适合搭配yolo算法。 rt+yolo在18-20年,是许多实时方法的标配。 其一个主要贡献就是把二阶段匹配改为了一阶段办法,和yolo的核心逻辑一样,都是通过简化步骤和流程的方式实现实时快速的预测推理。 孟繁岐相信,如果是汪海峰与自己通话的话,只要自己不藏私,大约30分钟到一小时的时间,就能够让汪海峰理解该方法的主要逻辑。 可惜与自己对话的是李彦弘,他的视角中算法和技术的成分更少,而是急于拿下政府项目这一块大蛋糕。 “今天很高兴能顺利达成共识,以后有情况我们再联络。”孟繁岐基本不准备插手米忽悠的事情,实股都懒得要,这趟来单纯是为了钱。 既然已经达成目的,也不再多呆。 二次元的事情,以后就算有情况也是让拿了实股的唐璜去管,自己确实不大懂那一套,也不准备关注,安心恰钱就好。 “事情比我想的顺利不少,那最近就没什么事情了。”孟繁岐原本的想法比较谨慎,以为需要个几天的时间。 不过得益于他目前和白度以及谷歌的亲密关系,这次投资进行得极其顺利。 “那我们就年后再见,我这几个月继续恶补相关的知识,苦练代码,不拖你的后腿。” 由于对专业不满而休学,计划出国,唐璜参与孟繁岐的这些事情最深,甚至赞助了最初用于实现目前所有算法的高配电脑。 加上他又是目前唯一即将和孟繁岐一同赴美的同学,唐璜庆幸的同时,也有不小的压力,诚惶诚恐。 认为自己德不配位,随时可能会被替代,这根粗壮的大腿抱不住。 他哪里想得到,自己在孟繁岐心中还有后世许多共同奋战的感情分,甚至于真正引导‘ai天才’孟繁岐走上ai道路竟然是自己? 不过孟繁岐也没有表露什么,他觉得让保持唐璜这种紧张的心态,让他多学多练是好事。 别的不说,他这几个月的努力程度就是前所未有的。 硅谷天才云集,唐璜不努力点属实混不进去,自己未来想让他分担一些压力会很困难。 大好的机会孟繁岐已经给了,能做到多少还是要看他自己争不争气。 处理完米忽悠的事宜,唐璜直接买高铁离开了尚海,回老家皖省去了。 如今交通便利,单程也就是三四个小时的事情。 孟繁岐计划在尚海再留一段时间,等到圣诞节后再回老家看望父母。 自从和李彦弘谈了合作之后,孟繁岐不知不觉已经有大约一个月的时间没怎么做正事了。 谈合同,做演示,改代码,前往澳洲参会,又游玩了几天。 和两个科技巨头建立了合作关系不错,可还是需要时刻警醒,自己早期的安身立命之本得是足够多的科技创新和技术突破。 目前这点东西还远远不够。 计划离开燕京之后,孟繁岐也有了余钱,置办了一款2013版的苹果acpro,以便随时可以工作。 此刻,他就近找了一家咖啡厅,独自一人坐了下来,对着笔记本开始梳理未来十几天的开发计划。 先尽快把白度那边的两三个需求解决了,这个不能花太久,最多分3天的时间。 这方面的内容孟繁岐已经有了具体的思路,应该没有什么问题。 剩余的时间,要去一趟谷歌上海,在那边把推荐和广告算法给调试好。 “谷歌广告一个季度就是两百多亿美元的营收,这个事情还是宜早不宜迟。” 虽然抽成的年限是固定的,可几个亿的款项早几个月迟几个月拿到手里差别还是很大的。 如果孟繁岐此时手里已经有了一个季度的抽成,那本次尚海之行,可以捡漏的股份就远不止米忽悠一家了。 这次的经历让孟繁岐稍微有了些急迫感。 手头没钱,自己记忆中记得的机会就会这样一个个浪费掉。 想到这里,顿时干劲满满,斗志昂扬地开始码代码。 此刻手机却是一震,打开一看,是王恺发来的微信,“哥,能带我走吗?” 第98章 多目标算法思路 孟繁岐和王恺这段时间沟通颇多,已经挺熟了。 不过看到这句话,孟繁岐还是觉得相当无厘头:“你一个一米八几的肌肉壮汉,我带你走什么啊?是我带你走还是你扛着我走啊?” “兄弟又被安排来找你了呀。”王恺一边说着,给孟繁岐发了一张机场的照片:“刚到机场,晚上的飞机去尚海。” “啥情况啊?” “这不是领导不放心吗,不敢使唤你往燕京来,只能派小弟我往尚海去。”王恺也是身不由己,虽说刚刚立了功劳,但总觉得这工作做得没什么提升。 “领导说,要让我在你身边吃透这部分代码,到时候回去跟大家讲解。” “还是跟上回一样的活呗。”孟繁岐了然,自己毕竟不是白度的人,李彦弘急着拿政府项目,肯定还是需要派人跟自己交接代码。 单看最后那一下,估计是不放心。因此派了此前和自己一直沟通的王恺来跟着自己,抓紧一分一秒,把孟繁岐新开发的这部分内容彻底掌握。 “行,这也没什么,明天我们在合川路附近那个白度的分部见。” “没问题,哥。”王恺答应得很爽快:“哥你要是以后有用人的时候,一定要想起我,不管什么时间,什么地点,兄弟肯定跟你干了。” “你这个带我走,搞了半天是这个意思?”孟繁岐这才回过味来。 “那肯定啊,打工肯定是没什么大前途的嘛,安安稳稳领点死工资,一辈子攒不下多少钱来。”王恺也不藏着掖着,直接说出了自己最真实的想法。 “我也不记得是哪里看到的话了,说人这一辈子每天都能至少碰到一个改变自己一生命运的机会,只是自己绝大部分时候都完全不知道。” “改变自己一生也得看怎么改啊,出门被泥头车创飞了也是改变自己一生。”孟繁岐倒是听过另一个版本:“我听过的版本是,一个人在硅谷一辈子一定会碰到一个一夜暴富的机会,俗称五个一。” “我觉得你就是我的机会,哥,以后要真创业,一定叫上我。小弟绝对尽职尽责当牛做马,鞠躬尽瘁死而后已。”经历了这两次孟繁岐的技术冲击,王恺已经彻底折服于他的技术实力之下。 很多时候算法不是能不能写出来的问题,而是能不能想得到。 过去几天内,白度ai研究院召回了一批在外奔波的技术人员,希望逐渐将重心转移回来。但忙忙碌碌快一周,在多目标检测追踪方面完全没有任何有意义的进展。 虽然最近白度ai的事业方面欣欣向荣,一片大好的局势,可不少内部的ai技术人员其实都颇有微词。 yolo算法很强,但根本不是白度自主研发的,只是借了孟繁岐的力量做了一个大的落地项目。 短期内确实是突飞猛进,若是长期去看,却不是什么好事,真正技术上的积累还不够。 尤其一下子来了太多项目和客户,研究人员被极大地分散了精力,不少人私下里都在抱怨自己在做职责外的事情。 政府方面的新需求就是一个很好的例子,缺乏时间去沉淀技术的白度一时之间根本是一筹莫展,还是得转过头去找孟繁岐做这个需求。 王恺觉得,与其这样反复去找孟繁岐,还不如自己干脆去跟他干算了。 以他对孟繁岐技术实力的观感,创业赚大钱只是赚多少的问题,根本不存在失败的可能。 听完王恺这一系列的内情,孟繁岐其实相当能够理解,管理层很多时候的想法和决策,确实对底层员工不大友好。 因为他们没有,也不可能真的从底层员工的视角去考虑问题,说白了打工仔的想法别人压根就不在乎。 “短期内确实没有创业的想法,可能两年后会有计划。”孟繁岐单凭技术分成入股的形式就足以赚够足额的财富了,再辅之一些投资,这样会远比创业轻松很多。 如果真的要自己出来办公司的话,孟繁岐目前只有一个计划,那就是在两年后,15年底的时候和伊利亚出走谷歌,一起办openai。 不过即便这件事情他也没有想好,因为在规划当中,15年前孟繁岐会把chatgpt需要的核心技术比如注意力机制和生成式预训练transforr都发表出来。 到时候说不定单纯技术和资本入股openai就好,做个技术顾问,没必要非得自己下场创业打工。 “到时候再说,我如果有什么动作,不会藏着掖着的,你到时候看到了记得联系我。” 有人这么早就认定了自己,孟繁岐也愿意让他加入团队,毕竟也是白度做ai的工程师,水平上没什么问题。 只是自己短期实在没这个需求,即便有,也不大好意思把李总派来对接的人直接挖走。 结束了简短的通话,孟繁岐开始检索匈牙利算法和库恩-曼克尔斯(k)算法,这两者其实都是老方法了。 比如匈牙利算法,就提出于1955年,是一种在多项式时间内求解分配问题的组合优化算法。 rt多目标追踪办法也只是利用这两者,以及孟繁岐提出的yolo,并不需要对这三者本身有很多的改变。 yolo算法作为特征提取器,用来提取所有的车辆部分。 匈牙利或者k算法,对相邻帧之间的若干目标进行最大匹配,卡尔曼滤波则根据目标轨迹的预测对结果进行一些修正。 尤其政府的场景当中,车辆的运动轨迹比较规则单一,这个方法的效果会相当优秀而稳定。 并且,在相邻帧中,孟繁岐还引入了iou距离,也就是两个检测框之间交集的面积,用它作为二分图匹配的权重。 同时也能够根据帧之间的距离计算车速,并根据车速范围合理设计相关参数的阈值,可以说是一举两得了。 在这个基础之上,还有改进版的deeprt,这个方法是从行人的识别中获取的灵感,通过对比两个隐藏层参数向量的距离来判断两者是否是同一个人。 不过孟繁岐并不准备那么周到,实现那么多,达成了基本需求就足够了。这部分继续改进的内容,他只打算写下一个思路在这里给白度。 时间还是用在谷歌上面比较划算。 第99章 故地重游 除了燕京这个城市,孟繁岐花了本硕七年+几个月实习之外,尚海是他印象最深的城市了。 那种其实想要留下,又无能为力的真实与残酷,使得他至今也对这座城市有种异样的感情。 他认为,向往尚海这样的大城市是很正常的,不正常的地方在于到底是什么在决定谁可以留下,谁不能留下。 孟繁岐如今普通消费早已自由,这次来尚海在浦江边上订了个五星。 清晨早起漫步在江边,一路往南边走,慢慢悠悠逛到了如今早已取消掉的南区附近。 这里有个城隍庙,有个园林,向来都是旅客来尚海必要看上一看的景点,地处最为中心的区域。 可偏偏在这个全国金融中心的核心地段,却有着大片的老城区老建筑。 往东几百米就是浦江,可城隍庙南部这方圆几公里内,几乎都是破旧的老城。 其中不少人家还得用公厕,使上痰盂这样的物什。 “或许这才是真正的尚海。”孟繁岐走在其中。 比起浦江两岸的繁华和各国风格的建筑,新天地附近,巨鹿路富民路人称巨富路。 这样的街头巷尾其实更加贴近真实的尚海生活。 前几个月曾经在孟繁岐围脖下面打广告的张学峰,借着当时的这点热度,如今提前有了一些名气。 他或许在很多事情上都有些争议,不过有一段话孟繁岐一直非常感同身受。 想体验真正的燕京,不要去什么颐和园,三里屯,那不是真正的燕京。 去国贸附近,坐830公交车去燕郊;去住了好几百万人的天通苑。 坐脚不沾地的公交车,住赶得上市级人口的小区,人称亚洲最大的社区,光派出所就建了四个,地铁站修了三个。 而真正的尚海也是如此,人头攒动的城隍庙附近全是老城厢,其中的生活质量和尚海的繁华没有半点关系。 江对面就是鹿家嘴,尚海的经济金融中心,孟繁岐过两天要去的谷歌上海分部就在此处。 可即便被繁华包围,这些东西又和普通人究竟有什么关系呢? 在这件事上孟繁岐还是十分清醒的,尚海打工,最终大连定居。 接近财富和权力会让人误以为自己掌握了它们,这种心态绝对要不得。 走在老旧的城厢街道中,孟繁岐并没有因为这些居民的生活环境和条件而对他们产生任何的同情。 2020年后,尚海彻底计划翻新市中心的老城厢,方圆几公里内全部水泥糊门,集体拆迁。 具体的政策孟繁岐没有了解太细致,毕竟他没有这个命。 只知道一份45平,独生子女分两份,对未来的配偶和子女还有考虑,因此不少二十来岁的年轻人分到135-180平难度不大。 不少人还在抱怨,说怎么从浦江拆到乡下去了,只可惜他们口中的乡下也是孟繁岐负担不起的。 因此,比起他们,孟繁岐觉得自己更值得同情。 不过这都是过去的事情了,重生回来几个月的时间,孟繁岐已经实现了房产自由,想住哪里住哪里了。 稍微逛了一下之后,孟繁岐就联络王恺去白度了。 多聊了几句,突然发觉,这小子原来本就是尚海人。 “你本来家就在尚海,这趟回来不就是公费回家了,抱怨个鬼呢?”孟繁岐在白度楼下与他碰面之后,很是无语。 “哥,不管事情怎么样,肯定要给领导辛苦的感觉啊!”王恺开始分享起自己的摸鱼准则:“领导就是容易见不得你闲下来,也见不得你工作做得舒服。” “这倒是真的。”孟繁岐在摸鱼一道方面也有不少自己的见解,一般下午三四点做完的事情,一定拖到晚上或者领导问起才会有反应。 只要你能做完事情,领导就会觉得你的工作不饱和,然后给你拉满。 事情多的时候,孟繁岐还会专挑凌晨睡前汇报工作,以显得自己似乎一直忙碌到那个时间点。 “没事,这几天跟着我的话,就不用搞那一套了。”孟繁岐整理了一下资料,安排王恺先去把算法背景搞懂:“你先把这两份资料搞懂,我去把基本逻辑和框架写好,你看完之后再来找我。” 匈牙利和k经典好用,原理也没有那么复杂,只是不是特定领域的人不会关注。 王恺此前也是对此一窍不通,乖乖领着资料就去看了。 孟繁岐则环顾四周,溜达了一圈,挑选了一个平平无奇的工位。 “正巧啊,这位置目前还没有人在使用。”孟繁岐感情复杂地笑了一下,这个工位正是他重生前曾使用了许久的。 时隔六七年,各种办公用具,装饰摆件都有不小的差别,甚至窗外的景致也有些不同。 同样的地点同样的公司,同样的写着代码。 只是地位上已经天差地别。 孟繁岐的代码改造工作非常顺利,这主要是因为他在写yolo这部分内容的时候,就已经考虑到了其他功能的扩展。 基于检测的算法变种还是相当之多的,最为擅长视觉算法的孟繁岐早就在对应位置留下了方便改造的接口。 当初只是因为资源有限,跑不了那么多实验,这才只做了最基础的部分。 设想中,是为了方便自己的程序员同行们做二次开发用的,却没想到自己竟然是第一个做二次开发的。 思路明确的孟繁岐,轻车熟路,很快就在yolo算法图的几个关键位置抽了一些特征出来。 根据选框的信息,设计了一下单帧各选框的陈列方法,并加入匈牙利算法测试了一下匹配情况。 这系列的任务孟繁岐太过熟悉,因此仅仅花费了一个多小时,就已经完成了一般。 加权的匈牙利算法其实就是k算法,在这个项目中,孟繁岐针对政府的场景情况专门设计了一下这个匹配权重的计算方式。 可以说,这样的单一场景,其实不用卡尔曼滤波器,效果也完全是足够好了。 不过,由于开发太过顺利,孟繁岐也就不打算偷懒,准备午休一下,下午把卡尔曼滤波也加上,事情就算是完成了。 “特么的已经快写完了?”王恺费劲巴拉地看了一上午,两个算法的原理流程刚刚勉强吃透,结果孟繁岐却告诉他这件事下午就可以结束了。 第100章 天网系统 从李彦弘那里接到了这个需求没错,可对于白度最近和政府的合作情况孟繁岐还不是特别了解。 因此中午一起吃饭的时候,孟繁岐便跟王恺打听了一番。 虽说王恺也只是一介小兵,知道的情况也不是那么多,但他一力促成了白度检测算法在常平区案件上的应用,或多或少还是打听到了一些情报。 “我听说这次李总是想接上‘天网’项目。”王恺放低了声音,有些神秘兮兮地说道。 天网这名字,一听就觉得不得了,不明觉厉。 真要说白了,其实是超大型监控系统。 总体投入了几千个亿,摄像头遍布全国各地。 在这件事情上,国外媒体喜欢鼓吹该系统无孔不入,监控国民,国内媒体则喜欢吹嘘该系统威猛神速,只需要几秒钟就能定位犯罪嫌疑人。 出于不同的目的,两边都对这个系统做出了过高的评价。 实际上,由于华国地广人多,即便投入了几千亿,摄像头也没法覆盖到媒体吹嘘的那么厉害。 警方办案的时候还是需要沿街找附近的商贩要监控。 这个系统主要覆盖针对的,还是交通道路附近,和人流量极大的场所。 如果只看比较大的城市,这个系统后来的威力确实不得了。 只要警方豁得出去,舍得投入人力像前几天燕京那个案子一样去看录像,想破案都是可以破的。 就只是忙不忙的过来的问题。 天网总体的建设历程还是比较长的,从11年开始就在持续地建设升级。 如此庞大的规模,如何智能快速地分析这些监控视频,也是一个非常大的难题。 “燕京说到底是一个卧虎藏龙的地方,上回常平区案件,多半是引起了公安系统哪个大佬的注意。”王恺狼吞虎咽地吃着饭,他也不敢完全确定,以他的层级接触不到这种大佬。 不过那件事情之后,和政府方面的对接明显顺利了不少,大概率是上面有政策或者风声支持。 “天网系统后面想搞好,肯定是少不了ai技术的。不管是人脸识别,车牌分析,违规违法的智能检测,有了这些东西,这么庞大的系统才能真的有意义。” 事实上,后续相关类型的系统也是这么去建设的。 基于全国范围的规模,ai智能能够节省的人力那可不是一点两点。 如今自己提早两年提供了可用的实时检测技术,天网自然想要一步到位,早些把这些ai智能纳入其中。 省得后面再升级,又有很多不便之处。 这次的道路检测,看来就是天网总系统的一部分。 如果可以把高速和重要道路上的这次项目做好,后续城市内,乡镇街道里,全国的和天网相关的项目,白度基本上可以说十拿九稳了。 没别的原因,其他公司没有孟繁岐这个技术实力,在政府面前跟白度一比,毫无竞争力。 “难怪李总这么急呢,我都大概说了思路,他宁可给我加分成,也不愿白度自己去研发。”孟繁岐的印象中,李彦弘可不是这么猴急,耐不住性子的人。 “介入的越早,试点得越早,白度最后能吃下的蛋糕就越多。”王恺由于常平案件,后续和政府对接频率高了不少,关于价格这方面,有点情报,“如果这个项目能介入,不说太多,只要超过五成,你猜流水能有多少?” “至少一千多个亿。”王恺刚刚问完,也不等孟繁岐思索猜测,就忍不住把答案说了出来。 “两三年的时间,至少一千来个亿的流水,白度去年历史最高峰,营收才百亿。光是这个天网项目,搞不好就能让白度营收翻倍了。” “更何况,其他杂七杂八的百万项目,不怎么费心的,更是数不胜数。” 一千多个亿当然不可能都给白度,里面还有许多其他成本,白度拿到手里的不是纯利润。 不过保守估计下来,按这个势头,白度14年的利润翻个倍恐怕不是什么很难的事情。 也难怪李彦弘稍微有失风度。 以前许多事情,终究是需要徐徐推进,李彦弘很多时候也能把控斡旋。 现在就完全是几个核心需求,有没有技术实力做出来的问题。 行就是行,不行就是不行。 一听孟繁岐说简单好做,李彦弘压根就没想把这几件事再交给愁眉苦脸的研究员们去搞。 不就是钱嘛!舍得分才有得赚。 况且,李彦弘认为孟繁岐的潜力和价值还远不止于此。 随着他的残差思想打开了真正意义上“深度”的大门,李彦弘坚信后面还有无尽的广阔天地。 既然无法得到这样的人才,就得舍得让利。 不得不说,李彦弘的思路还是相当正确的,把孟繁岐目前创业怕麻烦的心态拿捏得很好。 开发个几天就可以分项目好几成,还不用管事,这对解决这些技术需求和难题不怎么需要动脑子的孟繁岐来说,就像捡钱一样随意。 唯一有点劳累的,可能就是需要和对方交接代码了。 文档,格式,和解释原理。有时候对方死活不明白,还得一行一行地解释几段。 后续的这个服务耗时比开发的时间都长了。 下午时分,孟繁岐就完成了全部的开发工作 “我也别写注释和文档了,我解释给你听,你自己来写。”孟繁岐想了个办法,把这两件事合二为一:“好记性不如烂笔头嘛,你自己来写,写完了就懂了。” “好的哥。”王恺任凭驱使。 “之前的yolo检测其实就是多目标追踪的一个子集,子模块,目标的定位检测模块。多目标追踪无非是加了追踪器。 检测器只显示物体的位置,看代码这里,追踪器为每个目标会添加独有id,并持续到它消失。 这里你要注意,需要确保追踪器的速度一定比检测器要快。” 孟繁岐指着代码中一个个模块介绍道,王恺则在一旁疯狂打字记录。 一旁白度上海的不少员工,都早早认出了这个白度发布会上和自己公司ceo同框的年轻男生。 但看他一整天都在忙,也不敢贸然打扰。 第101章 创业机会 有了孟繁岐今天添加的这些功能,白度基本上就已经可以应对政府的第一波需求了。 不过确实如王恺担心的那般,白度如果持续专注于项目而技术沉淀不够的话,在后续的需求当中仍旧会遇到同样的问题。 只不过这件事对白度是坏事,对孟繁岐却并非如此。 当然了,白度并非是完全没有技术实力的,比如在车辆被检测出的基础之上,识别车牌这样的功能白度完全可以做。 最多速度和精确度上差孟繁岐不少,不过现阶段其他人也没有孟繁岐这个技术水平,其实完全可以接受。 “倘若天网这个巨无霸项目进展的顺利,下一步就应该是人脸检测了?”孟繁岐开始预判起了政府的需求。 ai后来势头是猛不错,但要说在政府项目内的应用,却也不是那么多的。 其中规模最大,使用最为广泛的,需求最核心的应该就是人脸识别了。 这方面的技术很早就被政府所关注,01年开始就被用于防范和打击重大刑事犯罪,在08年就已经规模化投入使用。 不过,这些办法全都是基于传统方法的旧时代产物了。 在阿里克斯揭幕深度学习时代,孟繁岐引领真正的深度网络之后,有关人脸识别的速度和准确度都能够有一个质的飞跃。 按照原本的时间线,2014年的6月,商汤会自主研发deepid系列人脸识别算法,准确率达到9852。 击败脸书同期deepface的同时,deepid的人脸识别能力首次超越人类的肉眼识别水平,也就突破了大规模工业化的警戒线。 同年8月,商汤获得数千万美元融资,10月份商汤科技正式成立。 发展到2023年,商汤的市值接近千亿,它最初的起家靠得便是超过人类水平的人脸识别技术。 那条时间线,残差网络还没有提出,孟繁岐思忖了一下,此时自己出手,即便不用太多后来的技术,单凭残差网络+arcface,想要实现995+的识别能力应当不难。 有没有必要做一个短线的创业呢?孟繁岐在这件事情上犹豫了起来,此时出手,技术实力上肯定是足够拿下政府系统内的人脸智能部分的。 就是不清楚贸然地创立人数较少的小型公司,是否够格能够接触到政府方面的负责人或者负责部门。 倘若没有资格入局,公司办出来就有些鸡肋,最后也许是一个被收购的结果。 e,仔细想想,好像也可以接受?孟繁岐看着王恺,若有所思。 之所以计划15年后再考虑创业,最主要的原因就是投入和产出不成比例,自己产出的技术好又快,分成拿钱远比自己苦哈哈创业来得舒服。 一个非常关键的事情是,许多ai技术现在做出来之后都是没法及时创业变现的,比如chatgpt的基础技术,注意力机制->transforr->gpt->gpt2->gpt3->gpt35(chatgpt)->gpt4。 这一路的技术升级,前面五个版本都是纯烧钱,自己未必就玩得起。 但在谷歌这样的大厂当中发这样的成果却卓有价值。 不过,这两日王恺的想法,让孟繁岐稍微产生了一些动摇。 加上技术分成的时间点和顺利程度也远超他的预期。 孟繁岐本以为13年底自己才会被关注到,而要到14年中后期才能积累起数千万的财富,却不曾想13年还没结束,手头已经积累了不少资金,有资格参与进来。 他自己下场去全身心创业还是划不来的,不过持股绝大部分,分出一部分股权来让王恺这样懂ai的大厂算法人员去做事,那还是相当划算的。 交代完白度多车辆检测追踪的代码部分,孟繁岐将王恺叫到办公室的角落里,靠着窗。 王恺一个一米八几的肌肉男,此刻看着像是被175左右的孟繁岐堵在墙脚,画面稍微有些诡异。 “我仔细想了下,也不是不可以。跟大厂去分成也是分,自己出技术,持股做大股东也是分。” 前者抽成少些,但胜在稳定,不用管那么多,是初期积累资产的不二之选。 现下资金已经不愁,确实也可以考虑尝试一下。 “哥!你总算想通了!有这技术,肯定拉出来单干了呀,像兄弟这样匀一点股权就肯给你卖命的,不在少数!”王恺喜出望外,财富自由的机会这是从天而降。 “不过,如果创业,现阶段我可能没有精力管那么多,只能提供核心技术支持。”孟繁岐这两年要发的技术和文章太多,过多地关注公司琐事不大可能。 “我可以出资金注册一家公司,我持有百分之60-65的股份,其余的用于招募一些非技术方面的人员。这件事你可以多上上心,如果较少的股权分配就能把人招募进来,你自然可以多分不少。” “我们第一个主要的技术产品是什么?”王恺先是大喜过望,但也很快冷静下来。 现在白度的工作虽然累了些,不过也一直处于上升期。投奔孟繁岐一定是没错的,可也得问清楚情况,也不能太过冒失。 “第一个核心技术是超越人类水准的人脸识别算法。”孟繁岐说到这里,不需要多余的解释,王恺就已经领悟到孟繁岐的言外之意了。 毕竟这段时间,他对政府项目的内容了解甚多,知道高精度的人脸识别系统是一个非常重要的需求。 “现在市面上的人脸检测算法还是老办法,我相信以你的水平,做出的产品一定可以甩开那些东西一大截。”王恺按捺着内心的激动,让自己尽量冷静地思索着。 “人脸识别算法的需求不比道路交通小,它在很多更加细粒度的场景应用的范围更加广泛。不管是海关,安监这样类型的政府项目,还是具体到公司的打卡,甚至结合今年大火的移动支付。” 王恺越说越激动,孟繁岐则是在听到公司打卡的时候两眼一黑,又回忆起了那不堪回首的岁月。 自己研发的技术应用到刷脸打卡这件事上,肯定得扣功德了。 “不过这件事没有那么紧急,还需要一两个月计划筹备,你先在白度做好手头的事情,以及这部分天网项目的工作。如果真的想出来跟我创业,就早点把交接做好,不要影响白度那边。”王恺毕竟是李彦弘的员工,平心而论,这段时间李彦弘对自己还算是比较照顾的。 因此孟繁岐又再叮嘱了几句:“如果要找人从你其他方面的关系去找,以前学ai的同学朋友什么的,你自己有想法出来跟我创业,最好就不要再拉走白度ai研究院的人了。” 虽然最早的这批白度ai研究院的人,两年后基本上都跑光去做自动驾驶了,但孟繁岐还是不大愿意主动去挖这些ai人才。 面子上不好看是一方面,另一方面是他后续还计划从白度那里捞一大笔数据出来呢。 “我大约年后可以把这个技术给出来,你也不必急着给我答复是否参与。” “怎么不急,急死了,我肯定跟着你干!” 第102章 论文被引 想要跟着孟繁岐创业是王恺自己的想法,可孟繁岐仍旧觉得有些不好意思,毕竟他是李彦弘专门派到自己身边来学习这部分代码的,直接拐走了有些惭愧。 于是第二天仍旧是来了白度,将白度目前针对图片识别车牌号的方法优化了一版,以做弥补。 说来惭愧,他在国内这段时间都在闭门造车,急于突破技术,累积自己在各个方向的技术威望,没有考虑过创业,也没有提前做创业相关的准备。 临时想创业的话,即便最后不准备做很大,也显得相当仓促。 首先就是身边没有技术人员可用,没有提前去物色,熟悉同学都还在读本科,不堪大用。 前世的那些同事有几个相熟的,且不说他们大多也还在读书,就这样贸然找过去也太离谱了,自己认识对方,对方却完全不认识自己。 这两个月在招募面试人才方面,估计要多费心了。 目前唯有王恺的确可用,科班出身,有大厂经历,有一批同样履历的同学能拉过来,和自己也算是熟悉。 “你要想好了,现在阶段跟我创业,我可没有多少余钱给你们发工资,你们自己都是拿一部分股份的创始人。”孟繁岐丑话说在前面:“而且过几个月我去美国之后,除了技术方面可以负责,剩下的就要看你们自己了。” “哪儿能让你再操心那么多!”王恺当场表态,别的那都不叫事。平时打工为什么没动力,一句话,公司不是自己的,就拿那点死工资,肯定是给多少钱干多少活。 钱给得少,整天又唠唠叨叨,这点钱,我很难帮你办事啊。 可如今有了股份就不一样了,这么大的比例虽然不全是自己的,但早期公司初步成型,只做纯软件部分的话,能够支撑将孟繁岐的ai算法做成产品给出去,那还是要不了十个人的。 六七个人足矣,即便是平均下来,每个人大约也能有百分之4-5左右的股份。 公司估值只要上两三个亿,这就算是财富自由的了。 自己上班的那小几十万工资,税后到手三十出头,除去每日用度,一年能存下二十五万最多了。 二十五干到六十五,将将攒够一千万。 创业公司奋斗,最怕的就是出师未捷身先死,满手期权变废纸。 这个最大的风险,在王恺看来,完全不是问题,不值得怀疑。 以孟繁岐目前展现出来的技术水平,想上市肯定可以一路做下去。 光是靠先进的人脸识别算法本身,公司直接出去卖到大几千万不是什么困难的事情。 如果能有几个完整的项目,估值上很容易再进一位数。 倘若真的插手政府项目,为海关,政府机构,交通站点内配备了这些技术,那就是王恺不敢想的天文数字了。 人脸识别项目是王恺心心念念的事情,在孟繁岐眼中,却是无足轻重,险些忘记的事情。 “能做的事情实在太多了,等谷歌这次推荐和广告算法更新之后,我得仔细规划记录一下了。” 此刻的孟繁岐正在更新自己谷歌学术的档案信息,此时距离他在西尼公开一大批论文时间不久,但距离公开生成式对抗算法的论文却已经有一些时间了。 他想看一看,自己这只蝴蝶,到底有没有引动什么很大的变化。 而最为方便的办法,就是看看到底有哪些论文引用了自己,看看有没有什么比较显着的研究成果。 更新了自己谷歌学术的档案之后,孟繁岐不由得惊讶,这才没几天自己已经有了二十多个论文引用数量了。 再仔细分辨一番,其实这二十多个引用量,竟然只来自于四五篇论文。 由于孟繁岐这一次的公布对整个范式的革命太过彻底,代码也开源,导致现在任何一个有关深度学习的研究,可能开局就要引用他好多篇文章。 残差,优化器,训练方法,数据增强,这四大金刚几乎谁也躲不开。 深度学习界每多一篇文章,孟繁岐的被引用次数几乎就会多四倍,并且这个倍数以后还会继续扩大。 截止2023年,人类历史上被引用次数最多的学者,总被引用次数将将百万之数。 而ai领域的文章数量,从12年的2万余篇每年,很快飞速增长到了21年的越135万篇每年。 照这趋势下去,不用四五年时间,孟繁岐就会以25-26之年龄,成为历史上论文被引用次数最多的人。 并在之后的岁月当中,狠狠地继续成倍增长。 “截止到我重生前,残差网络的原作者kaig被引用次数已经超过四十万。”孟繁岐稍稍回忆了一下,自己现在发表并计划发表的知名ai技术数倍于kaig。 等到23年突破三百万都不是没有可能。 学术论文写的都赶上网络小说了,被引用数就相当于订阅,文章的实际被阅读次数还要数十倍于此。 能将学术论文写到这个热度,想来也是前无古人后无来者了。 而这些已经公布的文章当中,孟繁岐所留的谷歌邮箱,早已被各路邮件挤爆。 孟繁岐点进去的时候,电脑直接卡了个半死,过了半分多钟才缓过来。 收件箱中,请教问题的,杂志社约稿的,求未公开部分代码的,还有同事打招呼的,什么都有。 这些邮件当中,英文居多,但也有一部分是中文写就,应该是清楚他的国籍。 扫了一圈,其中一封来自于尚海市公共卫生中心的邮件引起了他的注意。 孟繁岐检索了一番,该中心是创立已经百年的市级三甲医院,拥有诸多类型的大型先进医疗设备,尤其擅长肝类疾病的诊断和治疗。 孟繁岐查阅了一下该医院的详细情况,推断他们手头应当有许多疾病不同仪器的成像结果。 阅读完邮件之后,孟繁岐明白了对方的来意,自己之前更新的带残差的u分割办法,大幅度地提升了图像分割的技术水平和分割效果 尤其在比较细粒度的物体分割上,有了十分显着的飞跃。 而分割类型的任务,在医疗影像的应用上是非常重要的。 因为在医疗图像之中,通常都是各个科室初步诊断之后,去拍摄产生。 分类的和检测的意义不是很大,更进一步的内容分析是主要需求。 比如细致地将病灶区域分离出来,再比如协助诊断病变程度,这样会更易于医护人员诊断,节约大量时间。 “尚海的三甲医院动作真快啊,这就已经注意到我了。”孟繁岐知道u网络对医疗方面的重大影响,但他以为这会是年后的任务。 却没想到前天就已经有人找上门来。 孟繁岐端正了一下态度,感觉风雨欲来,政府和医院这两座庞然大物似乎都近在咫尺。 这次创业,似乎得认真一点了。 不说人脸这个规模很大的政府项目需求,单是医疗ai这一点,做好了都足够上市了。 孟繁岐仔细思忖了一下,觉得这两个方向最好还是分成两个公司去做。 改文情况汇报 这本书前面单机太久了,快二十万字提意见的读者才多了起来。 我基本算是纯新手作者,很多地方前期一直单机,写得些有问题,但也不知道哪里比较有问题,就埋头写。 最开始写的时候,早期没有那么多商业和创业的成分在里面,这个在早期章节里主角的计划中也可以看到。 初期更多是学霸文的感觉,发论文和技术为主,中期才会转创业。 读者们多了起来之后,很多都表示希望快点有商业的成分,所以临时切入了白度的剧情。 后面又表示钱赚够了之后,希望早点有创业的成分,希望看到事业心强一点的主角,因此最近也在找角度切入。 我个人对故事的情节走向没有什么执念,也在摸索的状态中,最开始把主角写得分到大钱就行,可能更多的是我个人整天加班之余对悠闲生活的期盼。 觉得太疲倦了,躺着分钱最舒服,本能就写成了这样。 有可能做到的话,尽量还是以满足读者们的愿望为主。 不过改动剧情和方向之后,有时候也会导致前面铺垫不够,或者有些细节我没有考虑周全,这个我尽量避免。 我最近根据反馈改动前面还是比较频繁的。 比如由于希望加强创业部分,因此跟谷歌的合约从三年改为了一年一签,计划是一年拉满论文之后跑路自己干。去之前国内创业一波,去之后在谷歌积累一年美国资源再创业一波。可能剧情上也会因为事业往返世界各地,不会和原本计划一样长待硅谷。 比如许多读者反应女配的戏份多余(本书其实一直未定女主),我前面已经删减了两章,后续的计划也有调整,准备淡化处理掉,引入一些新的角色看看反馈。 再比如一些合同有没有请律师啊,股权分配不合理啊,某些操作可能违规啊。 这些不清楚的地方我基本上都折回去修改或者打了补丁。 实在不大方便改的,确实也没办法了。 大家如果发现自己有的段落评论不见了,不是我删了,基本上都是改文导致改掉了。 虚心听取大家意见,合理的建议都会折返修改。 未来剧情的走向也会根据和大家的讨论做调整。 比如事业心不够,这个除了我个人想躺平本能体现出来了之外,另一方面也是因为原本学霸转商业的时间规划迟了,最近会调整加速一下。 有好几个书友整天帮我找剧情不合理的地方,还有专门纠正我错字的书友。 当然,更多的是每天默默追读的书友。 这个读者人数在来说当然算不上多,不过对我个人来说相比之前的单机已经好很多了。 十分感谢大家! 第103章 没有困难就制造困难 孟繁岐决定创业的两个方向,人脸识别和医疗ai,其中还是有缓急之分的。 人脸识别是一项已经应用了很久的技术,各方面都比较成熟,只是之前的方法比较传统落后。 一旦孟繁岐做出一些突破之后,可以很快切入进战场,展开收割,快速盈利。 而医疗ai还处于比较早期的阶段,其中最麻烦的问题是这些医疗数据与病人隐私方面的伦理问题。 在最最基层的数据问题上,就有不小的阻碍,各方面的手续章程繁琐。 虽然尚海公共卫生中心主动与自己联络了,不过这方面的事情恐怕不会推进得太快,需要徐徐图之。 应当先行着手处理的是人脸识别算法方面的事情,并且既然已经决定创业,自然要从商业的视角去考虑,而非是之前的学术角度。 孟繁岐了解这个时期最先进的人脸识别算法,比如脸书的deepface,原本是基于阿里克斯网络做特征提取,加入了分段仿射变换,使用了3d人脸建模来重现脸部特征,对齐面部要素。 脸书在14年的这个方法是深度学习时代人脸识别算法的奠基之作,影响力很强。 不过在孟繁岐看来,这个方法极其臃肿,参数多达上亿个,虽然在一个大型人类数据集lfw上性能为9735,接近人类水准。 但对孟繁岐来说,将这个性能继续提升到996往上是十拿九稳的事情。 不过,从数据上可以明显看到,这个指标剩余的提升空间其实已经很小了,没法很显着地拉开差距。 从学术的角度去思考这个问题,自然是不要紧的,只要突破了世界纪录,自然就是值得发表的研究。 可在工业界,思维却不能这么简单。 性能相差无几的情况下,还有太多其他因素需要考虑进来。 比如速度快慢,商业用途,对速度都有硬指标的要求,这一点孟繁岐非常有信息;再比如算法的算子是否比较常见?有些复杂的学术操作,在商业使用的时候并不方便,硬件设备可能不支持,这点有可能会出问题。 其他诸如价格,使用难度,用户界面的美观程度,甚至于宣发的ppt做得唬不唬人,都很有可能成为外行人做出商业判断的依据之一。 因此,孟繁岐觉得在人脸这个已经被比较成熟的问题上,单纯只是自己这2个多点的技术突破只是较大的优势,还不足以建立起绝对的优势。 既然是创业的第一枪,不仅要成功,还必须大胜。 孟繁岐计划要在这个领域构建起足够强大的技术壁垒,至少要让其他所有的科技巨头们在大几个月,甚至接近一年多的时间内退避三舍。 现在的人脸识别太简单?老办法就能做到96-97? 哥们给你上点强度,看看你到底能不能受得住! 孟繁岐的策略基于他最先公开的一篇论文,生成式对抗技术之上。 他计划将基于残差网络的对抗式生成网络做一些针对性调整,并拿现在业界最大的几个人脸图像数据去训练它们。 其最终目的,就是为了生成看上去栩栩如生,实际上根本就不存在的人脸图像。 等到这个生成模型成功训练之后,孟繁岐便可以用它去对现在世面上的先进人脸识别算法发起针对性的挑战。 这些市面上的人脸算法,许多都基于传统的特征方式,就连刚刚孟繁岐回忆到的deepface都还没有发布。 原本,它们最多就只有94-95左右的水平,距离孟繁岐可以做到的996差了不少。 在这样的基础之上,它们还完全不具备辨别生成式虚假图像的能力。 孟繁岐可以随意地用各种虚假的人脸图片去欺骗这些算法,甚至可以针对某一些特定的面孔,去生成对应的人脸图像,并骗过基于这些算法的各种安检产品。 直接从安全性这个最根本的问题上彻底动摇对方的商用价值。 试想,既然现在市面上已经拥有这样任意生成虚构面孔的算法能力,而脸书的人脸识别技术竟然毫无对策,完全无法分辨。 这就带来了巨大的隐患,真假不辨,产品识别成功放行通过的,谁都不确定到底是什么鬼东西。 同时,这些产品的识别精确度,识别速度又都远远逊色于孟繁岐的技术产品。 在这样的情况之下,所有的甲方,尤其是注重安全性的政府机构,都会做出最为明智的选择。 而作为算法设计者的孟繁岐,当然非常清楚这样的生成策略会有什么问题和漏洞,生成出来的图像又有什么人类无法发现的规律。 孟繁岐的人脸识别算法,将会同时具有首次突破人类水平的精确度,数十倍于目前世界一流算法的检测速度,以及当下独一无二别无分号的伪造检测能力。 与此同时,对孟繁岐的新计划一无所知的脸书deepface团队,正在集体研究孟繁岐的论文和代码,完全不清楚自己将会遭遇什么。 “我们正在做的事情是首个将深度学习用于人脸识别的开创性工作,用到的数据规模也高达百万,如果这个时候替换掉如此多的算法组件,会不会耽误太久时间?”deepface四人组中,杨明是唯一的华国人,他对此稍微有所担忧。 “杨,现在孟的残差网络已经席卷了整个ai界,如果我们还是使用去年的8层网络,这真的可以称得上是首个将深度学习应用在人脸识别上的工作吗?”沃夫人如其名,工作上很有狼性。 在他看来,孟繁岐对深度学习的核心,网络结构本身已经做出了革命性的突破。 如果不采用这种新的技术,那么自己发布出去的文章又或者是代码,根本就只是昙花一现,几个月之后,一定到处都是基于孟繁岐残差技术的版本。 既然已经意识到了自己的不足,那就一定要修正,不能怕麻烦,也不能怕时间不够。 残差网络开源发布出来,就是几天前的事情,所有人都在同一条起跑线上。 没有什么可担忧的。 deepface团队已经在这个方向上努力了大半年,如今只是更换一些组件,迅速地将终版的实验迭代一下,这耽误不了太久。 这么久的技术积累,难道会别人随意赶超不成? “杨,你不必担心,我们的主要步骤是检测->校正->再表达->分类验证,后面几个步骤都已经相当成熟了,只是现在有了更好的特征提取办法。” 泰戈曼也出言安慰杨明,他知道这个新加入脸书的小伙子急需一些成绩,“更换了方法之后,我们可以做得更好!” 第104章 这些人都不存在 “好。”杨明也不再坚持,但他总觉得哪里不大对劲,直觉告诉他好像有什么不大好的事情要发生。 “孟的新技术真的相当好用啊!”在这几天的实验迭代当中,脸书的deepface团队已经有了好几个较大的飞跃。 首先就是原本臃肿不堪的模型大小得到了极大的缓解,由于算子简单易用,速度也快了不少。 看模型的训练日志,算法的性能也是一路走高,很可能超越他们之前最好的结果。 “真不知道他是怎么想到的。”沃夫长长的叹了一口气,一个如此简洁的操作,就能够解决困扰了整个领域好几年的大难题。 “其实这种情况是最气人的,如果他真的搞出一套非常复杂的理论和操作倒也好了。”杨明很能理解大家心里的想法:“如果他的策略当真搞得十分复杂,我们也就彻底折服了,不会生出什么幻想和遗憾。” “偏偏他用这么简洁简单的办法把事情给办成了,给人的感觉就像是哥伦布在海上一直开,就发现了新大陆一样。其中的智慧和努力或许很多,可总给我们一种我上我搞不好也有机会的错觉。” 杨明的自我认识还算是清晰,知道这种‘我上我也行’的想法只是海市蜃楼,终究未堕落成键盘侠。 几位研究人员还是相当认可孟繁岐研究成果的,只是他们完全没想到,孟繁岐为他们还未出炉的最新算法准备了怎样的一份惊喜礼物。 人脸的识别可以说是整个计算机视觉领域当中,研究人员最多,应用范围最广,规模最大的一个方向了。 作为一个古老的课题,人脸识别这一任务历经了传统模式识别到现代深度ai的发展,已经相当成熟。 不过自始至终,它都被一个无法解决的难题所困扰,那就是图像中的遮挡类型问题。 普通的相片不是photoshop的图层,如果一样物体被遮挡住了,那么这部分信息就彻底丧失掉了。 没有任何技术手段可以还原当时的场景,就像去马赛克一样,是不可能的,被破坏的图层是不可逆的。 不过现在,我们有了新的办法去另辟蹊径,解决这个非常棘手的问题,那就是孟繁岐的生成式对抗网络。 通过大规模数据的反复对抗生成,生成网络将具备非常恐怖的图像生成能力,完全可以产生非常接近现实的内容去填充遮挡部分,虽然这些生成的内容有可能与原本的内容其实毫无关系。 可它看上去确实挺像是那么回事的,不影响人对于图像的理解。 何况,如果它事先看过相当多目标人物的其他照片的话,生成出的部分很有可能几乎和现实完全一致。 并且,生成还只是最基本的一方面,通过对隐藏层一些维度上参数的理解,人们甚至能够做到精细地调节图像的一些属性。 图像特定属性的编辑,是生成技术更为进阶的应用方式。 比如图像中,人物的情绪,脸部表情的喜怒哀乐皆可随着你的调整而做出相应的变化。 后来十分流行的假笑表情包,就是通过控制图像中人脸的情绪,使得原本悲伤愤怒的人咧开嘴巴,夸张大笑。 甚至有人会连贯地修改整个视频,让整个场面看起来十分滑稽,喜感。 除了表情情绪之外,另一个后来比较流行的是年龄调节,通过修改某些特定维度的参数,人们可以直接一夜白头,又或者是返老还童。 这些还都只是普通的图像编辑,并且只编辑其中面部的部分。 后面还有更加高端的算法应用,比如智能换脸,智能美颜等等。 前者在许多影视二创和鬼畜当中十分流行,人人都能‘演’三分钟大片。 想让谁客串都可以,关公战秦琼成为可能。 而后者则在各种直播平台上应用广泛,地上扔两只拖鞋都能给你自动上个妆。 “不过由于现在硬件和其他技术手段的限制,我还没有办法生成非常高分辨率的清晰假图,想要直接操作整个视频也稍显勉强。” 孟繁岐清晰地知晓目前自己可以做到哪一步,4k分辨率的高清图没什么办法,但二三百甚至五百左右的普通清晰度却是差不多够了。 针对一下目前阶段的人脸算法,绰绰有余了。 并且,孟繁岐如今已经有了谷歌大脑的研究员权限,调用几十张显卡不是什么问题,做这些实验的速度比起之前数十倍地增长。 待得这个模型训练完成之后,孟繁岐计划建设一个网站,叫做[这些人都不存在],来炒起热度,使得大家关注到这种人脸的伪造生成技术。 每次打开这个网站,都会随机生成一个栩栩如生,但实际上完全不存在的人物肖像照。 孟繁岐准备借助自己和谷歌还有白度的关系,宣传这个网站,通过这种方式来提醒人们,使得人们注意到原来识别算法一定需要有能力去分辨,图像究竟是真的还是人工智能生成的。 可谓是一举两得了,即宣传了自己的生成式技术,又给目前的人脸识别方向提出了一个短时间无法解决的大难题。 而借助这一年左右的时间差,已经可以轻松妥善处理该问题的孟繁岐,将形成牢不可破的技术壁垒,迅速抢占国内人脸识别方向的市场。 “不过即便这件事比较重要,仍旧还是要排在推荐广告算法的后面。”孟繁岐皱了皱眉头,若想创业,以后琐事一定很多。 推荐算法这件事情不能再耽误了,它是自己目前最大的摇钱树,也是以后多个公司的核心启动资金来源。 自己不可以因小失大,明天就要去谷歌尚海分部开始这部分内容的研发。 在测试结果成功之前,所有其他的事情都要为它让步。 不管是facegan脸部生成技术,建立公司,还是后续的计划,建立[这些人都不存在]网站,以宣传这种虚拟生成技术,都得排在推荐算法的后面。 等到这些内容都完成了,再抽空去和尚海卫生中心谈医疗图像智能处理的问题。 第105章 搞点大新闻 由于李彦弘发布会上的介绍,也由于实时检测算法对接政府之后成为了白度一个非常重要的收入构成。 这导致尚海分部的白度员工们对孟繁岐其人基本上是人尽皆知。 由于王恺在燕京常平区的顺利推动,政府机构结合新技术,办公智能化,高效化被当成了一个正面的典型。 一件引起了一定社会舆论的案件被光速处理,这对相关人员来说都是一大政绩。 因此,相关人员在谈论起人工智能技术的时候,个个也都不吝啬溢美之词。 公安部甚至有副部级的实权人员,在公开场合对人工智能技术进行了表扬。 虽然不是非常正式的大会场合,也不是盖了章的红头文件,但就华国政府人员通常的谨慎画风而言,其分量也已经相当之重了。 尚海作为华国第二重要的城市,理所应当地成为了白度推行ai首要关注的几所城市之一。 就在孟繁岐在西尼汇报成果的同时,白度尚海分部已经开始了与尚海各区政府尝试接触的工作,并且已经有了一些进展。 而一些类似燕京水文站那样的百万级小型合同,更是已经拿下了一两个。 按照这个趋势下去,本年度的奖金也是肉眼可见地要再加几个月。 这一切的源头,皆来自于面前这个年轻得过分的大学生。 打工人的喜恶就是那么纯粹,你再强再牛是一回事,大家也就说笑一番吹捧一下。 可若是你能让我年末多发两个月的奖金,那可就是我的亲人了。 结束了两天的在白度的快速开发之后,尚海分部的这一群人,执意要请客吃饭。 孟繁岐环顾了一周,可能是来得太早,也可能是以前的同事在其他分部。 并没有见到前世的熟人。 本想推辞,但又想到,现在拿人工智能项目对接联系过政府的并不多,跟他们打听请教一番倒也不错。 既然尚海市三甲医院给自己发了邮件,那么综合目前全国的情况考量,孟繁岐是计划将公司开在尚海的。 如此一来,学习一下白度尚海的一些经验,就很有必要了。 这顿饭的排场并不大,白度尚海分部也不是说人人都非要到场一起不可。 而是各部门抽出了一两位代表,大约十人左右,找了一家烤肉店,边烤边聊。 白度尚海分部,软件部分来了一位资深的后端工程师,大约三十三四的样子,孟繁岐也不记得刚刚介绍的时候怎么称呼了,大家都称他老李。 另一位软件部门的代表是一位数据库和系统方面的年轻工程师,与王恺相若,二十来岁。名为蒋明轩,与王恺组成凯旋组合。 从几人的相处交谈情况来看,王恺与他们极其相熟,这让孟繁岐觉得有些奇怪。 细问之下才知道,王恺本就在尚海分部工作了一段时间,后因燕京组建ai深度学习研究院,待遇有所提升。 而他又具备相关背景,这才内部申请考核,随后调任到燕京去。 在尚海创业,对他来说是一箭双雕了属于是,难怪他听说孟繁岐想将公司定在上海之后如此积极。 与白度尚海团队聊了一些过后,孟繁岐感觉到,尚海整体对人工智能方面的态度比较平淡,还不够积极。 从创业的角度考虑,2013到2016年之间,尚海,或者说华国整体都并没有很强力的对ai产业的扶持。 原本时间线,尚海对ai产业的风向变化始于2017年。 华国直接由国务院出台了《新一代人工智能发展规划》,明确要求到2030年,人工智能要[三步走],鼓励地方打造人工智能产业集群和创新高地。 政策一出,尚海的动作是最快的,光速响应,提出了发展目标,并且出台了相应政策。 这一方面是因为人工智能行业突飞猛进,另一方面也是因为2017年,辉煌了十多年的互联网行业整体趋于平缓,开始走向存量。 由盛转衰,即便是尚海也面临着产业转型的难题。 “2017年还是太晚了,我得想想办法,连续用ai成就搞点大新闻,推动政府早点开始关注这方面。”这样一来,一方面有利于之后国家在这方面的竞争力,另一方面创业也能少许多阻力。 孟繁岐已经无意识间,使得实时检测算法与燕京市地区政府产生了合作。 并且让公安部委级大佬注意到了人工智能技术。 但是,这种图像的检测和分析,和原本传统的图像处理方法有些类似,孟繁岐并不清楚外行人能否分清其中的区别。 况且这点火候恐怕还远不足以让国家提前几年制定相关的ai产业发展策略。 “实时检测已经打响了第一步,不过单独只是这方面的话,影响力还远远不够。我需要的是那种可以下沉到每个人的,要有广泛的影响力,普及度要高。最好能跟上移动端的这个潮流。” 孟繁岐一边思索着这个问题,一边与白度的职员们聊天。 谈话之间,他们频繁地聊到一些手机app的市占率,开玩笑说白度真是app收购冥灯。 再火的app,只要白度收购下来,没几个月、一年就全凉透了。 不说小的app,就说此时他们在聊的91,那也是一个无敌的大手笔。 此91并非是奇怪的91,而是91手机助手。 就在孟繁岐第一次接触李彦弘的一两个月前,白度用19亿美金的天价收购了91手机助手。 不过没有两三年,随着苹果自己平台的进步,各大手机厂家也纷纷推出自己的平台。 91助手很快凉凉,91苹果助手17年就停止更新,安卓渠道也于20年直接下线。 不过那是后话了,如今刚刚被天价收购的91助手正是如日中天的时候,累积应用下载量超过百亿。 平均到每个人头上都有接近十次下载的次数。 “或许我应该做的第一个产品应当是一个火爆的app,而不是某篇论文,某种技术。”孟繁岐反思了一下自己思想上的不成熟。 重生回来之后,为了获取初始资本,他花费了大半年的时间埋头写代码,做实验,准备论文。 这让他产生了不好的思维惯性。 或许这种论文+技术分成的方式,可以在学界有些名气和地位,但要真的做到人尽皆知,技术进入寻常百姓家。 做出像chatgpt那样人人都可使用的产品才是最终的形态。 孟繁岐仔细思索了一番,或许一款编辑表情和人物年龄的app,在这个时间点会对自己大有裨益。 第106章 希小虎 第107章 对答如流 第108章 烤烤你的呀 “虎总还有什么其他想问的吗?”孟繁岐咧嘴一笑,他早就发现希小虎在有意地考察自己。 只是他清楚,希小虎是谷歌尚海广告的领军人物,不说第一,至少也是第二把交椅。 如果不彻底打消他的疑虑,往后的工作不好开展,后续的推进和测试也很难顺利。 要知道谷歌每年测试各种方法上千次,最后算法想上线,还是需要依靠别人的。 况且希小虎现在也只是可以理解的怀疑,而非是恶意的针对。 希小虎听到自己被称为虎总,表情一僵,他感觉这小子是故意的。这称呼怎么听着傻头傻脑的呢?虎了唧的。 孟繁岐则一脸无辜地看着他,这他能怎么办,总不能叫希总,那岂不是抢走了以后老拜登的稀宗称号。 “看来孟同学确实对我们的整体策略非常了解了,只是不知道你又打算做出什么改进呢。”希小虎对孟繁岐本人并没有什么意见,如果对方真的能有所突破,这对于他来说也是一大成绩。 尤其本次研发过程,似乎是要在谷歌尚海进行,自己势必要成为负责人和把关者。 成绩自然是能分一杯羹的。 聊到这里的时候,希小虎已经基本收起了怀疑之心,至少眼前这个年轻人明显不是来添乱的,水平的下限已经有了保证。 接下来就要看他到底有什么高见,他的上限究竟在哪里了。 “我的想法,优化方面主要从移动设备和人工智能解释模型这两方面出发。”孟繁岐最开始起手的两个算法,均是谷歌15年迭代进去的方法。 与现在的年份有一定的距离,他确认了内部这部分还没有开始开发,但距离不至于太远,起到的效果会更加可以预期一些。 “其中前者是针对移动端网页的优化,可以预见地,往后的岁月当中,使用移动设备上网搜索的人会越来越多。我认为一个能够评估网页在移动设备上显示效果的方法,可以极大地提升手机用户的搜索体验。” 2013年底这个时间,不少网页在手机上浏览起来还是非常不舒服的,放大缩小很不方便,许多功能甚至不支持。 但搜索引擎中,注意到这个问题,并引入进网页排名的还很少。 而短短几年过后,pc端的网页就已经无人问津了,移动端的流量十倍往上翻。 给移动设备推送阅读体验差的网站,是对搜索资源的极大浪费。 听完孟繁岐详细的技术办法之后,希小虎瞳孔地震,完全收敛起了任何怀疑的情绪。 剩下的只有惊讶。 “你的思路相当巧妙啊通过特定视觉要求的判定,去确认网页的比例确实有利于用户当前的屏幕比例。” 作为内行人的希小虎,瞬间就意识到了这个方法的价值。 虽然它没有直观上直接创收,但这种对用户体验的照顾和关注,比起营收更让他这个技术负责人欣赏。 “这个方向还可以加入一个变种,那就是移动端页面加载快的网站优先。”孟繁岐打的这个补丁是谷歌18年加入的新判断。 移动端不比pc端网络稳定,网页加载速度也是影响体验的一大因素。 希小虎听完这个补丁版本的核心脉络,喜笑颜开。先前的怀疑如烟消云散,再也不提。 一把揽过孟繁岐的肩膀,道:“你这两个东西做出来,顶得上有的组一年的成果了!” “虎总不问基础问题了?”孟繁岐也乘机打趣道。 “唉!这叫什么话。”希小虎一摆手,“我随便考考你的呀!” 两人哈哈一笑,前面微妙的地方就算是揭过了。 “另一个方向则是对新版ai的引入了。”孟繁岐自然不会忘记自己的老本行,移动端适配的判断与ai关系不大,而这个解释模型则能够引入更多的因素去综合判断某一次搜索的相关结果。 这个属于非常重要的技术突破,孟繁岐明年还会开发transforr和伯特(bert)方法,也就是chatgpt的t。 到时候对这个解释模型还会有继续的升级。 即便孟繁岐一年多后离开谷歌,这个算法也会持续地迭代下去。 甚至可以说,它是一个非常低配版本的bg大小姐(gpt-4内核),有一定的语言理解能力足以帮助搜索引擎更好的理解用户的搜索语句。 不过还不具备任何看起来像智能的功能,也就没法真正和用户对话。 希小虎现阶段对ai的理解不是那么的充分,此时的语言模型基本上以时序类模型为主,也都是有一定年头的老技术了。 因此他多少还是知道一些:“时序类语言模型理解语句可能确实不错,但用在这么大的体量,会不会太慢?” 所谓时序模型,就是一个时刻的模型计算可能需要联系前后文,没有办法独立的进行运算,因此也就极大地限制了运算的并行。 本来一个人做一百题确实很慢,但一百人做一百题,那就是百倍速度的提升。 可若是第二题一定要第一题的答案才能做,那就没办法了,只能干等。 所谓一核干活,七核围观,说得便是类似的情况。 在这样的背景下,即便谷歌计算资源够多,也还是不好处理这个运算时间的问题。 要知道搜索时的延迟,那可比打开网页时候的延迟要命多了。 “虎总忘记我的老本行是什么了?语言模型的并行问题,我当然是有了想法才会提出这个计划。”论推荐广告,孟繁岐的细节远远不如希小虎扎实稳健。 但要说ai方向的突破,强如希小虎这样的大佬也远远不是孟繁岐的对手。 而孟繁岐这次准备的推荐广告三板斧,除了前面两个专注于移动端优化,和搜索词理解优化之外。最后一个弗雷德算法则是专门惩罚性质的方法,它的效果最立竿见影。 “我的最后一个算法策略,专门在搜索结果中寻找低价值内容和各种欺骗性广告以及各种会员链接。以最严厉的惩罚方式,来迫使网站倾向于高质量原创内容和优质的用户体验。” 至此,谷歌在19年前的几个主要推荐广告算法的基础框架已经被确立。 只待孟繁岐去开发完成。 第109章 准备上线弗雷德 谷歌的最大收入来源是广告,广告的最大收入来源是搜索推荐,而搜索推荐的核心则是相关网页的排序排名。 之所以搞竞价排名,就是因为用户的注意力是有限的,就如财富一样,最少数的顶层页面会获取用户超过95的注意力。 普通用户的搜索次数,每天阅读的页面数量都是有限的,如何在有限的页面数量当中,推送最多的有效广告便是推荐广告算法的核心问题。 所有的广告商都知道,自己付出的广告钱至少有七八成都打了水漂。 可问题就在于,谁都不知道到底是特么的哪两三成发挥了作用。 该付的钱一分钱也不能少。 对于谷歌来说,如何更好地规划分配这些展示界面,就是无本万利的营收方式。 举一个极端的例子,如果谷歌可以做到推送给每一个人的广告,都恰好是他所需要的,会点击的。 那么就实现了推荐广告的理论上限,用最小的展示赚到了所有的钱。 只可惜,目前这个比例大部分厂商做不到百分之一,即便是谷歌,也只在百分之二左右。 孟繁岐提供的“移动端优化策略”和“弗雷德算法”,其目的就是为了进一步剔除那些手机端看起来不方便的网页,和各种引流垃圾网站。 做得是排除法,只要我把垃圾内容给多排除掉,那么剩下的内容就更有可能被点击。 而结合语言ai模型,做得则是加法,通过更好地去理解用户的搜索意图,以提供相关性更加强的结果。 如此一来,每次用户搜索后看到的界面更加相关,垃圾场网站更少,进而起到更多广告点击的效果。 根据原本时间线的经验,孟繁岐预估这三板斧挥完之后,效果的提升应当在两成起步。 希小虎越听思路细节越觉得有意思,原本只计划聊个几分钟的,不知不觉接近一个小时都过去了。 两个人也没有专门找一间会议室,而是就在前台的招待处附近找了一个沙发,侃侃而谈。 不少上班路过的谷歌员工,看了之后都相当惊讶。 希小虎的职级还是相当之高的,不少谷歌尚海的员工很少会直接与他接触。 少数实习生甚至连见都没怎么见过这位大佬。 “唉!周桓,陈灰,正好。你们过来一下。”希小虎余光瞥见了两个路过的谷歌员工,直接把他们叫了过来。 周桓和陈灰两个人刚去冲咖啡回来,就见到大领导跟一位学生样貌的年轻人一起在聊天,甚是好奇。 白度那边由于立刻宣发了产品,李彦弘亲自做了两次宣传,不少人都认识孟繁岐。 而谷歌这边杰夫和辛顿除了在谷歌大脑内部做了介绍之外,并没有波及到太多不相关人员。 因此专注广告部分的周桓和陈灰此刻并不清楚孟繁岐的成分,看他如此年轻,又能和大领导谈笑风生,还以为是托关系进来的实习生。 “领导!你就放心,我们两个肯定给他照顾好!”希小虎刚介绍了一个名字,周桓不等希小虎发号施令,就抢先表态。 “行行,你们把本地相关的账号,权限和工具准备一下,他这段时间主要在这里从事我们搜索推荐部分的工作。”周桓和陈灰都是组内有些资历的老工程师了,技术上有分寸,也懂得如何带人。 希小虎觉得,虽然孟繁岐的想法相当周密出色,但毕竟还是第一次进广告算法部门写核心内容。 别的不说,熟悉这些已有的东西总归要不少的时间。 毕竟懂得原理跟吃透代码可以自行开发创作,还是差了十万八千里的。 他看出两人误解了孟繁岐的身份,但却没有任何提醒他们的意思。 一是因为,孟繁岐的确如同实习生一般,需要熟悉很多内容。 二是因为,周桓陈灰这两个人,平日里总是仗着自己有点小聪明,经常眼高手低,动不动就给他惹出点小麻烦。 两人此前立功不在少数,他也不好多说什么。 “哼!这次就让你们好好见识见识什么叫人外有人。”看着孟繁岐跟着两人往工作区域走,希小虎咧嘴冷笑了一声。 “小兄弟今年几岁?读到哪里了?”前往工位的路上,周桓开始了询问。 “二十出头,明年读大四。”孟繁岐据实以告。 “好!”周桓在心中大声叫好,他方才看到孟繁岐和领导在聊天的时候,便已经私下跟陈灰打赌。 赌得便是孟繁岐是否是实习生,现在周桓以为自己大获全胜。 周桓一边继续与两人往前走着,一边将左手背到了背后,四指勾动,示意陈灰愿赌服输。 而陈灰则翻了个白眼,掏出手机给周桓转了个200块的红包。 “你的内部账号已经办理好了?”周桓见孟繁岐坐下后不久,就轻车熟路地登录上了谷歌内部账号,顿时感觉有些不妙。 “是的,现在主要是需要你们把广告算法上线的流程稍微跟我介绍一下,我需要获得这个过程中所有相关数据和脚本的权限。” 孟繁岐大概知道这个测试流程,通常是离线先在不同的规模上进行测试,然后局部上线,测试正常后会推行至全局。 每个阶段都会留存好备份,以便发生问题可以随时回滚。 “我超,谷歌大脑?”周桓分配权限的时候看了一下孟繁岐的邮箱后缀,吓了一跳。 此时的谷歌大脑虽然还不是后来的巨无霸团队,但由于明星工程师杰夫的领衔,多少还是有点名气的部门。 陈灰嘴角勾起,洋洋得意地冲周桓抬了抬下巴,按照规矩,不搞清楚情况就先伸手要钱,这可是要双倍返还的。 周桓大呼失策,只得不情不愿地退了200,又转了400过去。 孟繁岐稍微侧了侧目,大概明白这两个家伙在干什么。 资本主义公司就是不够狼性,整天把心思花在这种有的没的上面。 接过权限的孟繁岐,第一个要实现的是弗雷德算法。 涉及ai的部分,需要一段时间准备和训练,而移动端优化的方法,短期测试可能不够明显,14年晚些时候效果会更好。 但弗雷德算法对于互联网垃圾网站的筛选能力是非常惊人了。 上线了该算法之后,可能目前接近7成的网站都会受到很大的影响。 第110章 我那么大一个网站呢? 谷歌除了adwords之外,还有一个平台叫做adsense。 是一种快速简便的创收方式,一般是有一定流量的网站申请加入,从谷歌这里接一些相关的广告,从而进行分成。 只要加入了这个网站,就算是谷歌广告内容发布商了。 这里的adsense就很像是大家所熟悉的各种自媒体形式,有了大量的流量和读者之后,就会有广告找上门来, 但既然作为一种创收方式,就难免会被薅羊毛。 有许多网站上,完全没有任何具备实际意义的内容,除了广告就是广告。 它们可能藏在任何奇怪的地方,不以正常地形式出现。 比如在你想要点开一个视频的时候,竟然需要先打开两三个叠加在上面的透明广告浮窗,才能够真的选中到自己想要查看的内容。 这就让人血压非常之高了。 不过,通常敢这么做的网站,都会有自己的核心竞争力。往往是拿一些让人急不可耐想要观看的东西做诱饵。 又或者是一些收费资源。 良心点的站点可能会真的让你看到。 倘若是碰到无量骗点击的垃圾网站,关掉三个广告之后,点开看到的搞不好会是葫芦娃。 孟繁岐还碰到过天才式自动弹窗的界面,在不慎点开某个广告之后,就如核裂变一样,该广告迅速触发了多达二三十个其他广告。 弹窗的速度是关闭网页速度的十几倍。 不消两秒钟,整个显示器就被彻底填满。 这种所谓的广告点击,计算了费用,可显而易见的,几乎不大可能产生任何实际价值。 虽然谷歌看上去并没有因此受损,因为这些点击都会产生广告费用,不过这只是非常目光短浅的想法。 如果广告的效果不好,广告商终究会在对比当中发现这件事情,从而逐渐流向能够提供更加优质服务的公司。 让这类垃圾网站总是出现在搜索首页的话,也会使得用户逐渐感觉不适。 这两件事可是谷歌屹立不倒二十余年最最核心的支柱,庞大的搜索用户群体和大量的广告营收。 希小虎之所以一直排斥小聪明操作去创收,其实针对的就是这种情况。 不过孟繁岐提出的方案,显然走得不是希小虎最先预想的骗点击的路子。 尤其第三个方法对垃圾网站的打击,力度相当之大,让他十分看好。 谷歌尚海的工作氛围不卷,至少上下班不打卡,就给了人很多操作的空间。 很晚还在的同事不多,孟繁岐最是厌恶内卷的奋斗比,没想到现在风水轮流转,自己成了曾经最讨厌的那种人。 看着窗外灯火通明,俯瞰尚海最繁华地区的夜景,孟繁岐也不禁感叹。 其实这世界上哪有那么多人真的愿意躺平,还不是因为给的太少,事情太蠢。劳累也就罢了,还有人骑在你头上非说这是福报。 是不是福报你工人爷爷自己难道不清楚吗? 倘若工资翻个几倍,按华国法律上下班,周末节日加班费给到位,钻进被窝里的咸鱼们马上就是一个鲤鱼打挺。 领导!活在哪?兄弟们全就位了! 你看现在钱给得多,他孟繁岐不是恨不得住在公司了? 再有一周多就是圣诞了,孟繁岐不大清楚到时候继续推进度是否方便顺利,因此这几天是起早贪黑。 很快就把弗雷德算法做了出来。 周桓和陈灰在算法本身上没有帮到什么忙,但在各方面琐事上还是让孟繁岐获益良多,节约了许多时间的。 比如数据预处理方式,测试流程,文件权限,涉及人员的沟通之类的。 此时此刻,他们并不像希小虎一样,清楚杰夫与孟繁岐所签下的合约。 并非ai界的两人,没有关注白度的新闻,也不知道孟繁岐如今炙手可热,在人工智能界已经声名鹊起。 只把他当做了新入职的后辈照顾,才本科就能签下正式的研究员合同,实在了不得。 两人心中只是单纯的这般想法。 而当孟繁岐的成品摆在他们眼前的时候,两人面面相觑,这才发觉自己仍旧是远远低估了对方的才能。 “我超,这特么是你一个人半周开发出来的?”周桓当场一个震惊,双腿一软,险些没有站稳。 像之前提到的动物系列算法,熊猫,企鹅,那都是好几位资深工程师反复打磨过的。 想在这一大摊子复杂系统上另起炉灶,添加一个算法,可不是什么简单的事情。 “这回叫个什么动物?”陈灰的关注点比较奇怪。 “就叫老虎算法。”孟繁岐恶趣味地说道,希小虎最初专门来考验自己,那他便在名字上回应一下。 此话刚出,周桓陈灰两人就嘿嘿嘿怪笑了起来。 什么老虎小虎,最后还不都是英文tir,这正是希小虎内部交流时经常用到的名字之一。 两人看热闹不嫌事大,都举双手支持。 “我在比较小规模的历史真实数据上测了测,感觉还不错。”孟繁岐自己已经调试了一番,但大规模的情况,他没有那个经验,因此还是要拜托两位前辈。 “没问题,我们今天就拉个线上大规模数据库走一遍,如果没什么情况,尽快推两个局部测测看。”周桓和陈灰是这方面老手了,每年参与测试接近百轮。 有他们协助,测试进展比自己来要快不少。 “你的惩罚力度会不会太高了一点。”午餐过后,跑测试的两人在查看一些数据情况,发现很多网页的流量都被限流了超过8-9成,这是相当狠的力度,一般不是很常见。 “不下点死手,那群网络垃圾生产者怎么知道改呢。”孟繁岐实际的设置其实比后来谷歌版本还要宽松一点,毕竟第一轮测试,他不敢太激进。 “看指标收益效果好得有点过头了。”陈灰指着最重要的那个+11的数字说道:“就怕上了线不大一样。” “先上四分之一个洲的范围看一下线上效果。”这时候正好是美国清晨,此刻上线,如果顺利,没有出什么情况的话,明早起来可以收一个24小时的单日效果。 周桓熟练地操作了一番,并选择了一片加州区域作为测试地点,希小虎很快审批通过。 不久,太平洋的另一边,一个盯着黑眼圈的青年白人刚刚起床,惯例检索了一下自己的营收网站想要查看排名是否又上升了。 却发现在前十几页都找不到它。 ??? “我网站呢?我那么大一个月收上万美金的网站呢?” 第111章 吸吸更健康 搜索引擎和广告投机商的战争由来已久,双方来回博弈拉扯,手段层出不穷。 谷歌每年近千次的各种算法更新,其中有一多半都是为了针对这种投机网站。 由于谷歌体量太大,广告收入涉及的金额每年经常超千亿美金,由此还专门滋生出了一种职业,叫做搜索引擎优化师(seo)。 顾名思义,就是专门研究谷歌的搜索推荐策略,想尽办法为客户的网站提升相关排名。 目的就是为了让它胜过同行,取得行业内的优势地位。 谷歌频繁更新方法的一大原因,也是因为要确保:绝对没有某一部分搜索引擎优化师可以长时间掌握财富密码。 这点其实和网络文学刷数据一样,每一位作家都希望有更大的曝光,让更多读者看到自己的小说,以此获取利润。 可这是跟小说网站的最大利益相悖的。 因为优质的小说,愿意付费的读者才越多,如果真的把靠前的位置都给了这些刷数据的小说,读者看了之后只会骂娘。 “什么档次的小说,也排在前面?” “现在整个榜单都没两本可看的了。” 长此以往,就会流失用户。 对于这种动摇根本的行为,一定要严厉打击。一旦发现,再无推荐,让你针对性的投入付之一炬。 孟繁岐此次所做的更新,就类似于小说网站打击刷数据行为,只不过方法和逻辑要复杂很多。 当然了,这些算法惩罚的也不只是违规行为。 比如对移动端的优化,其实就不是违规,只不过优化之后用户才会更乐意去观看。 所以,许多时候谷歌都会公布一些新算法的偏好,留出一两周的时间去供相关网站整改。 这点其实也和小说网站很像,编辑神秘兮兮地来跟你说,“最近扫黄打非了嗷,小说里写过什么自己清楚,给你三天时间整改。没改干净的,到时候书被屏蔽了别来找我。” 不过那是比较正式的版本更新了,像这样以测试新算法效果为目的的短期小规模测试,则是不会有这种预警的。 内森就是本次孟繁岐新算法的受害者之一。 他的生活模式是网瘾少年转自由职业者。 很早就关注到了谷歌广告这个规模惊人的经济体,并很早就开始尝试通过给自己的网站引流,接谷歌广告进行创收。 作为叛逆期白人中产家庭的孩子,内森傲慢自大,自视甚高。 一向以薅谷歌羊毛实现财务自由为荣。 他手底下有四五个垃圾网站,规模有大有小,唯一相同的是这些网站上有意义的内容都基本为零。 内森钻研谷歌的惩罚逻辑已久,并且狂中有细。 虽然自视甚高,但是绝不贪婪。 寻常人见到有捞钱的机会都会想着最大做强,而内森则坚持原则,从不当出头鸟。 “最后一个兵不补。” 维持不高不低的排名,严格控制规模,这样的方针才是长久之计。 三四年来,谷歌的算法更来更去,内森的几个网站都曾受到影响,但除了有一次被抓了典型之外,总体上即便被制裁也都不痛不痒。 专心再钻研几个月,总能把流量再运营回来。 林林总总,年收入大约维持在十多万美金左右。 其实这算是孟繁岐前世梦中的生活了,不用上班,时间非常自由,工作地点也没有任何限制。 自己安排时间,凭借一些专业技术,获得不亚于工资的收入。 孟繁岐也曾做过一两周的搜索引擎优化,不过由于谷歌退华,加上他进入领域晚,短期内并没有太多营收。 只是略作了解,就退出了这一领域。 像内森这样完全不做贡献,凭借有流量的网站吸血的人,其实孟繁岐并不反感。 因为归根结底,他们吸的是谷歌这样大资本的血。 以孟繁岐之见,也没啥不好,吸吸更健康。 大资本要那么多钱做什么,我们小屁民如果真的能抽出九牛一毛,对消费和经济循环想必也是卓有贡献。 只不过目前孟繁岐准备亲自来做这件事情,从源头上狠狠大吸一口。 历史的车轮滚滚而过,内森这样的投机者,注定是算法进化过程中的牺牲品罢了。 即便不情不愿,但什么都没法改变。 “该死的东西,我的网站从来没有被惩罚得如此凄惨过。”内森从后台查看了一下几个网站的流量变化,最轻的也是8成以上的流量惩罚。 并且随着时间的推移,情况还在恶化。 按照这个情况来看,至少半年内流量是绝对回不去了。 此刻倒霉的内森也只是千千万万个互联网广告投机者的缩影,类似的吸血者就如内森脸上的雀斑一样,不可计数。 “为什么没有任何的更新公告?”内森也算是老玩家了,他迅速地检索推特,谷歌官网等相关网站,包括几个内部交流群。 发觉这两天根本没有什么消息传出。 他当然没有蠢到要拿自己的网站去问谷歌人员这是什么情况,现在算法检索惩罚或许只是九成五的流量损失。 若是让谷歌工作人员真人看到页面内容,那就是百分百的人没了。 内森的社交账号伪装的很好,他刚准备佯装路人询问相关问题的时候,很快便发现早已有人在推特上为他发问了。 “我的网站流量出现了很大的波动,这种变化程度是史无前例的,请问谷歌方面做了什么新的算法更新吗?googlesupports” “我们的确在加州部分区域小规模测试了一下一种全新的内容筛选算法,该方法还比较新,甚至还没有一版确定的名字,这里可以请我们的算法提供者回答一下孟繁岐。” “目前可以确定的是,该算法的效果非常理想,会逐渐扩大测试的范围。虽然还不确定什么时候会全体上线,但我们今天晚些时候会公布该方法偏好的内容,以便各位做出相应的调整。” 谷歌的客服每天要接到上百个类似的询问,因此反应非常迅捷。 “嗯?”怎么还有人圈我?孟繁岐看了一眼,一眼就识破了投机者们的小心思。 如果没有过多的广告,老虎算法的惩罚程度根本不大的。 放心兄弟们,这些钱我替你们赚了!不用谢我! 挥一挥衣袖,带走了所有的钱财。 不过孟繁岐也没有多说什么,只是留下了“老虎”两个字就潇洒离去,深藏功与名。 这便是日后的推特红人在此应用上的第一句话。 第112章 董事会的三巨头 第一版老虎算法起到的效果超过了孟繁岐的预计,这可能是因为几年后的检测排查算法对现在的投机方式进行了降维打击。 也有可能是因为选择的地区较为繁华,加州的总体经济情况在美国处于领先地位,大约是前五前七的水平。 经济发达的地方,这样的投机行为总归会多一些。 不过不论如何,单独老虎算法就已经初步测试有接近超过10的提升,即便保守估计,最后的收益也会超过6-7。 根据2013年的财报估算,谷歌14年单季的广告营收应当在125亿美金左右,其中因为新算法获利的金额很可能在10亿美金左右。 虽然根据协议规定,孟繁岐只能抽14年3成,15年1成,但三个月内见账3个亿美金,也已经是史无前例的神话了。 并且,达成这个成果一共只使用了不到一周。 让孟繁岐没有想到的是,这件事情甚至已经直接影响到了谷歌的董事会。 这也难怪,季度间的增长通常最多是个位数,这回加上算法提升的部分突然来了一个接近二十的百分比,拿大头分红的董事们不会注意到才是怪事。 只是没想到会这么快。 如今市值数千亿美元的谷歌是硅谷神话,而这个神话的董事会则是由创始人谢尔盖-布林,拉里-佩奇和前谷歌ceo施密特三人为核心。 谷歌现在最为核心最为成功的广告营收方式,便是施密特带给谷歌的。 如今已经不再担任谷歌首席执行官的施密特并没有完全退休,仍旧在使用他老道的经验和过人的智慧为谷歌出谋划策。 多年来他的老谋深算为谷歌保驾护航,在很多风险甚至没有迹象的时候就被他出手摆平。 这也证明了两位创始人当年拉他入伙是多么正确明智的选择。 三人组一直是一动两静的模式。 施密特负责总体掌舵,提出许多计划,力图最大化谷歌的利润和财富。 而两位创始人作为技术天才,则从总体战略和技术层面上拥有一票否决权。 如果说没有布林和佩奇,就没有谷歌的强搜索技术和独特精神,但没有施密特,谷歌就缺少了最强的营收能力。 无法将手渐渐伸向这么多的其他领域,也就没有了重塑互联网格局的庞大能量。 可能也只有施密特这样既有很强的技术背景(贝尔实验室),而后又成功在运营管理领域取得惊人成就的人,才能够与布林和佩奇如此平等地合作。 而施密特作为一己之力从源头上挖掘出谷歌广告潜能的人,理所应当地也是最能够理解这次算法更新威力的人。 广告部门对下季度的盈利判断放在了董事会的桌子上,所有人都没有办法忽视那十几个点的收益提升。 百分之5-6左右是预估提升,百分之10左右是算法收益。 关键是这东西它不要任何成本,只是单纯在现有条件下对推荐结果排序的优化。 无本万利的事情。 “天才,实在是赚钱的天才。”施密特深知目前谷歌的广告系统是优化了多少轮的形态,能够轻松从上面再抠出百分之5-6都是整个部门努力的结果了。 他孟繁岐单枪匹马,就拿下了超过10的提升。如此出色的吸金能力,不由得董事会成员不赞赏。 谷歌的营收中还得减去一些只有董事们才知道的隐形成本,算法提升的实际效果在董事们的眼里其实比孟繁岐预计的要更好。 不过欣喜之余,他们同时也发现算法提供者的分成比例显得有些惊人了。 “这倒霉合同谁去签的?按这么算,一个季度就分三个亿,一年下来十个亿了。”谈完正事,施密特突然提到了这个惊人的优异测试结果,以及夸张的分成金额。 也不怪施密特说这个话,他作为董事会三巨头之一,这么多年来从谷歌的得利也只在几百亿美金之数。 创始人拉里佩奇,今年230亿美金身价都登上全球富豪榜第二十了。 现在突然来了个新人,起手就是一个算法薅走这么多,换谁来也觉得离谱。 “杰夫去签的。”视频会议的另一端,佩奇脸一黑,签是杰夫去签的,但作为现任的首席执行官,这个分成合同是他点的头。 “杰夫和辛顿都认为他是ai领域不可多得的人才。” “人工智能人才怎么跑去写广告方法了。”施密特有点无语,这个合同在他看来有点离谱,换了他来是怎么也不会签的。“怎么搞的,分了那么多利润出去。” “我特么怎么会想到他广告算法玩得这么溜?”佩奇2011年从施密特手里接回谷歌,大刀阔斧地砍掉了营收不行的项目任务。 并赞同杰夫,重点投入了无人驾驶和人工智能相关的项目,这次招孟繁岐,也是为了这些项目。 “招你进来是搞人工智能的,你倒好,去给我刷广告收成了是?真有你的。”佩奇此时的心情高兴又复杂。 心说,怪不得回来之后杰夫的表情怪怪的,估计他早就有所察觉。 原本那些图像类和人工智能项目,即便能分出去大几千万,少说也得要一年的时间? 谁能想到孟繁岐完全换了一个根本不一样的赛道,人还没来,就等着看14年财报分钱了。 招你进来是挤牛奶的,结果你抱住一只绵羊就狠狠地拔毛。 还专门捡农场主最爱护的那一只。 不过,分得多说到底还是意味着赚得多了,施密特第一时间在意了一下分成的数额。 但看到只是一年三成,第二年一成之后,还是觉得可以接受的。 毕竟羊又肥了不少,胖了好几斤,少点毛不至于计较。 只是三人丝毫不知,这还只是孟繁岐这一轮广告三板斧的第一式。 要知道,三个亿美金即便对三位董事会巨头来说,也不能说是很小的数字了。 即便是布林之后因为怀疑妻子和马斯克有染,怒而卖掉的特斯拉股票,价值也才36亿。 而后孟繁岐的每一板斧,都让三位董事会成员再一次重复了一遍这个感觉心痛,后又觉得可以接受的过程。 好在孟繁岐在这方面记得的内容一共也没有多少,几轮板斧挥完之后,招式便用尽了。 这才没有在在职期间因为利润的事情和董事会内成员产生矛盾。 “分成的金额太大了,不可能给太多现金。股权,避税,不同洲法律上还有空间,这件事安排人专门去做一下。”施密特在这件事上下了最终的结论,“现金还是要流向更有价值的地方。” 若是孟繁岐在这里,就会非常清楚施密特所指的“更有价值的地方”,便是智能家居公司尼斯特nest。 14年1月,谷歌32亿美元收购尼斯特,是继收购摩托罗拉之后最大的一次收购动作。 孟繁岐最终在一年内单靠推荐广告算法分走的利润会和这次收购不相上下,考虑到这个情况,这份合同确实签得离谱了一些。 正在继续埋头写代码的孟繁岐毫不知情,除了谷歌的董事会之外,还有一位前谷歌高层注意到了他。 并即将展开联络。 第113章 意外的邀请 相比效果显着,非常出色的老虎算法,移动端优化排序算法的效果要稍差一些。 因而孟繁岐并没有急着推动上线测试,而是等待结合ai语言解释模型的那一个更新准备一起推动。 目前针对语言问题所采用的通常是循环神经网络(rnn)和长短期记忆办法(lst),这两个工作都是上个世纪末的老办法了。 这两种方法简明好用,因而一直兴盛到2017年左右。 直到transforr,也就是chatgpt的t方法出现。 通常来说,大家都认为transforr方法之所以能够迅速取代rnn和lst,主要是因为它更方便并行进行。 在多个设备上并行方便最核心的意义便是让规模庞大的版本成为可能,这也为后来chatgpt这样的究极巨无霸模型奠定了基础。 “其实老版的rnn也有办法可以把并行做得很好,领域内对这件事有很大的误解。”孟繁岐皱着眉头思索道。 原本时间线,transforr出来之后,所有人都放下了手头老方法的研究,拥抱了t方法。 可18年实际上有人专门做了rnn的高度并行,只可惜已经太迟了。 如果这个发现可以早一年的时间,可能rnn会长期作为t办法的竞争对手,我们也有可能看到chatrnn的出现。 “早期的t方法需要很多数据,各种参数比较难调整,需要的计算能力也很庞大。”孟繁岐即便根据后来成熟的许多方法做了一个改进的版本,t方法在早期仍旧比较麻烦。 “好在谷歌的数据和算力都不缺,而我也比较熟悉各种经典的参数设置。”孟繁岐先写了一个雏形版本的t方法,进行了一下测试。 “不过,受限于现在显卡的显存,模型没有办法做得很大,除非我专门再去开发deepspeed这样的高级并行方式。” 在多张卡上训练模型,可能是为了追求速度,也可能是因为一张卡上放不下了。 其中,数据并行是最简单的,也就是不同的卡都在做同样的事情,每张卡上都会存放一个模型。 只不过输入的数据不一样,不同的卡做完运算之后,再一起整合更新。 就像是所有人都拿了同样的刀切不同的菜,最后把切好的食材堆在一起。 可有的时候,一张卡上根本就放不下模型,这样的情况就比较麻烦了。因为一个人根本拿不动这把刀了,需要多人协作。 可以把每一层拆分到不同的卡上,也可以把不同层分配到不同的卡上,如此一来,其实是用多卡实现了类似单卡训练的效果。 显然,前者会比后者容易非常多,前者只需要在不同卡上复制这些模型,分别读取数据做运算就好。 而后者则需要根据不同的情况和设置拆分合并,一个不小心就会搞错。 看了下谷歌大脑的服务器,里面有好几批2013款的gtx泰坦,这东西着实价值不菲。 考虑到当时的其他产品,6g的显存还是鹤立鸡群的。 比起孟繁岐自己重金购置的4g旗舰款,多出的2g显存,足够做很多其他的事情了。 用速度换显存,孟繁岐又做了许多参数和信息在cpu和gpu上反复转移的操作。 因为在正式入职之前,谷歌大脑分配给他的显卡就已经有16张泰坦,这部分卡拨给孟繁岐独享,随时都可以使用。 除此之外,还有32张在不同节点上的gpu可以申请占用。 “这时候的谷歌显卡还没有那么多,这个配置已经相当大方了。” 不仅有统一配置的系统和环境,还有提供好的多卡并行方式和例子。 再过两年,几千张上万张tpu都是标配。 孟繁岐如果想要将ai接入搜索系统,有三个主要的方向。 一是通过拆分关键词,通过语言模型来获取其在现实世界的含义,从而对结果进行更好的排名。 二是通过扩大模型的规模,使得它具备一定的宽泛理解能力,从而扩大能够搜索的内容量。 三则是让搜索引擎更能够理解不同语言顺序会如何改变查询的意图。 其中二目前比较难办,一和三孟繁岐的把握很大。 传统的rnn和lst的循环方式,就导致了在较长语句上比较难处理得当,对顺序的变化理解也没有那么充分。 孟繁岐的雏形t方法,在这方面具有得天独厚的优势。 除此之外,t方法虽然在小数据上难以学到东西,各个参数也很难微调,总体的训练难度大。 但这在孟繁岐这个老炼丹师面前,不是什么难事,配合谷歌早已备好的海量数据,孟繁岐对这个方法的效果还是很有信心的。 而将显卡资源都投入训练之后,在13年的圣诞节前夕,孟繁岐结束了在谷歌尚海大约十天的工作旅程。 模型的训练需要一定的时间,广告算法后续两板斧可能过两周,元旦之后了。 总算基本完成了早期生涯吸金最多的技术,孟繁岐如释重负。 就在他计划开始开办公司,开始看工作场地,设备金额的时候,一个意料之外的电话打乱了他的节奏。 “孟先生您好,我是创新工厂李开赴的秘书,他很想跟你面对面谈一谈,但由于身体原因,出行不大方便,不知道您方不方便过来呢?” 李开赴?也算是谷歌系的华人大前辈了,最高做到全球副总裁,中华区第一把交椅。 不仅如此,他也曾在苹果和微软干到很高的位置。 不过09年四年约到期之后,他就辞职不干了,自己搞了一个天使基金投资大学生的梦想。 “李开赴老师现在在哪里?”孟繁岐对李开赴的经历还是比较熟悉的,此时应当正值他罹患癌症初期,只是不知道他在何处接受治疗。 “李开赴先生先在宝岛北市接受治疗,如果方便的话,我们就约一个时间?其实这段时间的治疗效果并不是特别好,因此李先生已经基本不再参与任何会议和公司工作了,不过他执意要抽出一天时间跟你聊一聊。” “我现在刚刚结束了手头的事情,明天就可以去办理入岛许可证。”孟繁岐觉得有些奇怪,自己虽然在ai界崭露头角,但对于李开赴这样级别的前辈来说,似乎没有什么是非见不可的。 尤其考虑到他目前的身体状况不是很好。 “不过办理下来,也该是两周往后了。” 孟繁岐问了秘书,她也不大清楚具体的原因,孟繁岐便压下了自己的好奇心,约在一月中旬见面。 尚海飞北市桃园,总共要不了两三个小时,比去燕京其实还近一些。他两辈子还真没有去过宝岛,去见李开赴顺便走一圈倒也还不错。 只是入岛许可证,却像签证一样,办理起来让人很是不爽。 第114章 创业花钱似流水 创业的各项准备和成本还是挺高的,不少步骤都较为繁琐。 如果不是依靠两次分成,不小心已经财务自由,孟繁岐可能还是更倾向于技术分成躺着收钱。 其中最大头的消费主要是办公经营场所,这个地方不先置办好,公司的执照还有银行户头都是拿不下来的。 再有其他的,就是办公用具采购和相关计算设备了。 做ai相关的技术创业,这方面的硬件是没办法节省的,不仅是高价的显卡需要许多。 其他作为支撑的cpu,内存和硬盘之类,也万不可节省。 像尚海这样的地方,出租的价格细致到了每平米每天,着实没有什么必要。 这时候网络上的信息还不如后面那么详尽,总还是要实地走访一番,着实颇费精力。 值此圣诞佳节之际,太平洋那边的白皮黑皮们都在载歌载舞,国内仍是一片灯火通明。 “要说还是谷歌富啊,环球金融中心租那么豪华,一平米每天二十多块,是漕河这边的七八倍了。”漕河附近此时写字楼每平米每天也才一两块钱,三四百平的面积一个月万把块。 孟繁岐再次来到熟悉又有点陌生的漕河附近,只不过这次却并非来打工,而是物色自己的办公场所。 他的身边跟着一个国字脸面相周正威严的中年男人,此人有君合事务所经历,专营互联网电子商务,跨境电商和资金股权等事宜的结算。 在数字经济和互联网泛金融方面也比较熟悉。 不过由于与个别大佬合伙人不合,导致自己晋升和工作开展不顺利,加上年纪不知不觉也快50了,在这样的情况之下顿感疲惫,便想走出来换换心情。 高文和与谷歌上海广告分部的合作颇多,因而与一部分谷歌员工熟识。 由于谷歌广告本次将要给孟繁岐的分成金额过大,尚海这边便是高文和负责对接,并与孟繁岐解释这部分的拆分和避税情况。 这也是高文和在君合的最后一件工作任务。 他怎么也没有想到,正是这一次任务,彻底改变了他往后的人生走向。 在君合遇到瓶颈的他心灰意冷,出走去做自由人,却一不小心却在这个年纪焕发第二春,而且还是在自己根本不大明白的领域内,成了日后ai帝国的一号员工,首席法务。 人生就是如此的荒诞。 “小哥,你是要买还是要租,我们地产公司在这附近的资源还是很多的。高层景观,私密独栋,应有尽有。” 他方才已经确认过,孟繁岐并非是职员,而是自己便是老板。他身边那个看起来像是老板的,反而好像才是员工。 严长春从业时间不长,不到三年之期。 不过他估摸着,今后的从业生涯当中,恐怕也很少有机会能看到这么年轻的老板了。 “我倒是想派小弟来,这不是公司还没开始办嘛。”孟繁岐倒不觉得自己来挑公司地址有什么不妥的地方,毕竟要面试别人,有个办公场所总显得专业很多。 况且再不早点订下来,时间就有些不够用了。 “要说是买还是租,倒没有想好。可能先看看租的,这两个月三百平绝对够用了,以后可能还得再换。真要看得到很合适的,五百平左右可以考虑买下。” 孟繁岐也想一步到位,下个一两千平,但就怕手头的钱不够挥霍的。真要看到喜欢的,咬咬牙应该也买得下来。 此时漕河附近的写字楼,一平也要个万把块,若想一步到位,基本就快把孟繁岐手头的2400来万掏空了。 孟繁岐跟着严长春在漕河附近逛了逛,看到几套千平出头的整层连在一起,很是喜爱。 分体式空调系统,八部电梯候命,东南西北皆是落地大窗,楼下的大厅相当气派,楼层还送一个小花园。 最重要的事情是,它目前空着连续的好几层,这对计划开两家公司的孟繁岐很有诱惑力。 只可惜总价正好与他手头的金额基本相当,而且是单层。 这人有了钱啊,消费就容易升级。 孟繁岐仔细看了一下这一层的工位,紧凑点可以安排约300人左右,前几年都完全够用了。 眼见孟繁岐踌躇犹豫了一番,严长春经验不算老到,为人却还算机灵。 连忙上前说道:“这地方现在来的企业不多,这几层也空了有段时间了。我们这最大分期比例是一半,您要真想要,但资金却又一时周转不开,完全可以先付五成首付款,约定一两年内还完剩下即可,利息很低,还可随时提前补上。” “五成首付,大概千把万。”孟繁岐思忖了一下,自己起步阶段最多十来位员工就够了,工资的支出一个月要不到百万。 其实只要撑过最开始的三个月,孟繁岐从谷歌广告系统的分成可以说是源源不断了,几千万的场地购买费用,完全是小意思。 “直接买下倒也可以。”漕河这里写字楼没有说多涨,过几年两倍总还是有的。 公司要一直开下去,买下总是不亏的。 显卡服务器等东西又多又重,先租一个场地,过几个月可能又要整个搬迁,实在累死人。 “就这一层。”孟繁岐选了这几排中最下面的那一层,打消了非要提前置办好以后升级空间的念头。 即便很快做出app,飞速扩张之下,一年之内300多个工位也足够了。 再说了,他这个老板也就在这里呆两个月左右,今后若是真的要换地方,再让他们自己操心好了。 还是得早些确定工作场所,招人进来。 爽快地签订了合同,严长春很是高兴。这一单除去契税百分之三,印花税0025,他绩效的抽成也不在少数。 上千万的大单他这三年也签了一些,但签得如此爽快的着实不多。 电话联系,周边看一圈,对比一下,看中的直接下单,这就叫做潇洒! 此处自带精装修和基础桌椅设备,严长春仔细再介绍了许多相关的事宜,比如水电煤,各种设施等。 孟繁岐爽快干脆地签了单付了订金,但是却有些愁,到底怎么能招募到足够好的人才。 如今这个节点,社招难度大,马上都过年了,恐怕社会人短时间内没人愿意来。 工作过的人都知道干活多辛苦,赶时间怕是指望不上他们了。 孟繁岐开始打起了尚海几所顶尖高校的主意。 第115章 做题不如纯真 高文和律师能够跟谷歌尚海合作多次,在业内还是小有名气的。 他退出君合之后带着两个实习律师加入了一家连商标都没来得及注册的初创公司,此时很快成为圈内茶余饭后的谈资。 敌视高律师的那一派对高文和极尽嘲讽,不过理智的路人还是比较多的,猜测其中必有内情。 只有少数几位接触到谷歌资料的人,才知晓其中的缘由。 孟繁岐只依靠几天时间开发的算法,就能够从谷歌帝国之中攫取上亿美金的利润。 经常经手谷歌系财务相关内容的他,深知这个数字的厉害之处。 高文和认为,自己不论怎么猜测他的技术实力都不算是高估。 如此早期选择加入,换换心情之余,也是觉得此事大有可为。 “其实你也不用等到明年三月的第一季度,谷歌今年年底的统计出来之后,这部分的金额就会结算给你。” 高文和知道谷歌方面在想办法避税,将数额化整为零,将时间线尽量拉长当然是不错的办法之一。 “谷歌可能会想办法提前预支一小笔给你,数额大概不到一个月的分成金额。这样的话,这部分钱会统计在2013年的收入里。” 这里面的门道还是很多的,尤其涉及到跨境,如果这笔巨额收入分两年支付,可以操作的空间就大了不少。 不过这就不是孟繁岐需要操心的部分了,不论谷歌那边是为了什么又是如何操作的,于自己这边来说早些拿到一部分钱总是好事。 高文和离开后,还有其他专业人士去和美国的财务法务对接,再往后的事情他就不清楚了。 但一般来说,不会迟过一月份。 “那就再好不过了,谷歌即便只是把今年年底这两周的利润先分给我,短期内我就再也不会有什么经济上的压力了。” 比起从白度那里预支的数百万美金,谷歌这里可以分走的金额,按周算都是小几千万美金。 “等场地执照什么的办下来,我就总算就有些正经点的工作了。”高文和笑道,以他的资历,和孟繁岐出来一起看场地买卖合同,实在是大材小用。 起草员工入职相关的合同模板,以及其他一些琐事,都交给了他带来的两位年轻人。 高文和已经和孟繁岐仔细聊了公司起步的第一枪,这个人脸编辑的app做出来之后,相关的内购问题,数字支付问题等事务孟繁岐一窍不通。 同时,孟繁岐的计划又显得有些紧凑。 这方面的内容需要高律师去迅速敲定解决,以确保不会耽误进度。 借着这款app的热度,孟繁岐下一步会迅速跟进推出新一版世界顶级的人脸识别算法。 如此一来,则又要涉及和大小各异,性质各不相同的公司敲定需求和合同。 到那个时候,才是真的忙碌的时期。 “还是得赶快招人啊”孟繁岐有些发愁,“海量的设备要采购安装,技术开发人员,销售会计财务都得招。” “我觉得你的计划就挺好的,去顶级学府里抓大学生和研究生,先把东西开发出来比较关键,其实销售财务那些倒可以缓缓。”高文和是多年老油条了。 “马上年关了,大家都在等着发奖金呢,你怕是挖不到什么人。也就只有高校在读的技术人才好招。” “社招挖来了也都盼着过年呢,怕是没心思好好干。”孟繁岐作为资深打工仔,深知这一系列心理活动。 “这紧要关头还是得看我们小镇做题家的。”孟繁岐顺口就是一个十年后的流行语,让高文和听着有些新奇。 “小镇做题家这词倒有点意思。”高文和刚刚听完,眼前就顿时浮现了一个出身小城镇又或是农村,除了埋头苦读之外别无所长的形象。 这样的人他见过不少,大都十分努力勤奋,只可惜他们最后往往由于缺乏社会资源和社会视野,走了许多弯路。 孟繁岐也算是典型的小镇做题家了,本科开始的时候贪玩了一些,但拼了一年半的考研,也算是名列前茅。 做题的本领很强,但视野上逊色了不少。也曾早早听闻了人工智能和比特币,却从来未曾想过这些东西跟自己有什么关系。 抓着家里给报的夕阳行业就一条路走到了黑,所幸电气相比土木、冶金等专业还是好上不少,即便当年他没赶上人工智能末班车,能进地方电网也算是安稳了。 换个再糟糕的专业,那日子实在不敢想。 “题目做得再好有什么用,远远不如纯真的微笑罢了。”孟繁岐咧嘴自嘲道。 心中感叹的同时,不知不觉地低声溜了几句礼堂王者,纯真一郎的单曲。 “奕!悟!哥们在这跟你说唱。” “也许我只是溜大了~就像你的人生糊弄糊弄不就得了么~” 听得高文和是满头雾水,只当是现在小年轻的奇怪喜好。 敲定了办公地点之后,孟繁岐先去谈了一笔数百万级别的设备采购。 虽然心里知道英伟达这一两年牙膏挤得很快,但现在创业赶时间,新款产品等肯定是等不得了。 必要的投入没必要节约,孟繁岐很爽快地先配置了三十套高配置pc+笔记本。 随后更是豪掷数百万打造了几台上流配置的服务器。 在人工智能没有崛起的2013年底,办公采用如此高配置设备还是非常罕见的事情。 办公电脑往往都是总价小几千还被宰上一刀,到手的配置可以说是丐中丐。 一口气签这么大的单,供应商因此显得格外热情,积极地询问了地址和一些具体情况,承诺手头有货的三天内一定上门安装调试妥当。 一些基础的it适配服务就权当附送了,暂时无货的东西一周之内也一定想办法给到。 孟繁岐闻言颇为满意,转过头计划着去尚海几所顶级院校挖人。 可打了几个电话才发现,高校的政策和管制还是挺严格的,自己现在这个三无的情况,压根就不符合进校去宣传招聘的要求。 “这下真麻烦了。”孟繁岐怎么也没想到这一点,他在尚海高校没有什么关系和熟悉的人,一时间还真没什么办法。 “兄弟,快看围脖,你火了!”就在此时,许久没什么动静的唐璜突然发来的一条微信,还附上了围脖的转发页面。 第116章 顺水推舟打广告 “你小子不是说闭关学习吗?怎么偷偷刷起围脖了?” “不是我偷偷刷的,你快看看就知道了,哈哈哈哈。”唐璜确实没有偷偷刷围脖,他都是光明正大刷的。 这消息与前几周参加的国际计算机视觉大会有关,内容非常离谱,当然得分享给孟繁岐这个主人公。 尤其是文字的描述内容,那是各不相同,格外有趣。 孟繁岐点开一看,嚯!瞬间老脸一红。 上回参会国际计算机视觉大会,会后不少人都对孟繁岐公开的数篇论文和工作十分感兴趣。 因而将其团团围住,这个阶段又放了一些媒体的人员进来,对着台前就咔嚓一顿拍。 有几张照片出图的效果相当不错。 处在画面中心的年轻华国学者和周边不少上了年纪的国外学究们形成了强烈的反差。 加上孟繁岐本人勉强也称得上是英俊,放在这样一个学术的场合,肯定对颜值还是有不少加分的。 孟繁岐会后几天也曾高强度自搜了几轮,却失望地发现报道其实远远没有会场感受的那么热烈,那么受欢迎。 那么多镜头咔咔给他一顿拍,孟繁岐还以为自己真的成大明星了。 实际上只有寥寥几家媒体刊登了一些报道,也不是特别好的版面位置。 配图虽然不错,但文字描述挺简短的,热度也不是很高。 孟繁岐看后觉得,果然人工智能这样的技术想破圈,还是需要战胜李世石又或者是chatgpt这样革命性的大事件,才能够真的走到台前来。 否则都只是圈内又或者是业内自嗨罢了。 很大程度上也是这件事直接导致孟繁岐的想法从学界转换到创业的路途上来。 国际计算机视觉大会上开源的技术已经比较多了,质量普遍也不低,但这些普通人是不会去关心的。 就连白度的文心一言,大家也能够将它和李彦弘联系在一起。 可t方法和gpt的真正作者和算法提出者,谁又会记得呢? 孟繁岐因此改变了想法,在突破算法之余,也要尽快创业做出产品,力争将系列产品迅速推给大众。 他压根忘记了还存在另一条快速获得热度和流量的方式,那就是纯造谣啊! 要论造谣炒热度,还得是看自媒体。 围脖上这几张图不知道是谁扒得外网,照片拍得虽然不错,一群白发老头把中间的孟繁岐衬托的似乎格外年轻有为,但围脖这内容和事实是p的关系都没有啊 “近日,在美国的一场数学交流大会上,我国的年轻学者一鸣惊人,引得一众国外学者连连赞叹,争相询问讨教。” “少年强则国强!西方学界数十年未能解决的数学难题,竟被他一朝破解!” “震惊!中国少年暴打美国诸多数学教授!” “你特么倒是从里面给我找一个数学教授出来啊???”孟繁岐看完之后两眼一黑,险些晕了过去。 完全是经典自媒体风味,开局一张图,后面全靠编。 按照他们的这写法,似乎恨不得直接颁发一个靳东口中根本不存在的诺贝尔数学奖给自己。 孟繁岐仔细看了一下照片,发觉后面的白板和投屏的幻灯片上都是一些外行人看起来很像数学的公式,哪里还能不明白这群无良媒体是在看图说话。 这些推送消息看似称赞,实际上是很败坏路人好感的。 不少围脖下面已经有了这样的声音。 “学界也要搞饭圈那一套了?能不能先把文案的领域搞搞对?” “这一张图里三个殿堂级的计算机方向大牛,你跟我说是数学难题?” “几周不见,孟同学怎么跑去搞数学了?我怎么不知道?胖球”这是来凑热闹的李彦弘。 孟繁岐一周前给到他更新的内容之后,政府方面在道路检测上的要求那是超额完成了。 很快就谈下了几个区域的试点,如今正是心情大好的时刻。 闲下来上上网,看到如此有趣的内容,李彦弘也不解释,而是孟繁岐的围脖账号继续拱火。 不过,虽然李彦弘没有出言解释,但围观的群众们很快就闻出了不对劲的地方。 此时距离上回的发布会时间还不久,马上就有人贴出了孟繁岐和李彦弘当时在发布会上的那几张同框图。 围观的吃瓜群众一看,嚯,这不正是被诸多白发老教授围在中间里的那位吗? “啥情况啊?自媒体造谣还能歪打正着?” “如果要把数学领域换成人工智能的话,这些看图瞎编的内容你别说,好像还挺真的。” “其实这个世界上最恐怖的就是,媒体完全编造出来的东西其实恰巧和事实相差无几。” “哈哈哈,学霸的围脖名还挺可爱的,胖球。” 孟繁岐不知道的是,这次的自媒体热度,其实本来远远不会如现在这般,有如此高的热度。 白度的宣发部门注意到这些虚假新闻之后,其实在背后推波助澜了不少。 先将这个完全不着调的东西炒的热起来,然后再切入进来揭开真相。 一来,自己有辟谣的这层buff,二来,吃瓜群众们自己好奇去探索这个人的经历,自然而然就会关注到白度的发布会以及和政府成功合作的两个项目。 最高明的广告不是去推送,而是诱发受众们的好奇心,让他们自行去探索。 这样才会记得最牢。 可他们万万没有料到的是,这一波隐蔽的宣发炒作,最后竟然被孟繁岐这个蒙在鼓里的人给摘了桃子。 孟繁岐什么也没想,他只是单纯地觉得,不知为何今天围脖对我的关注度好高啊。 既然如此,我不如打个招聘广告? “本人的人工智能创业公司今日成立,急招ios安卓app开发工程师数名,前后端财会人力等也有需求,详情请看附图。” 孟繁岐顺水推舟,直接将自己早先拟定好的需求和待遇的大概情况,一股脑地发在了围脖上。 这下广告费省了不少,原本这样的初创小公司招人就难,真要走常规途径,各种app和给猎头的费用都是不小的一笔。 李彦弘看到之后,心中一紧。 他早就知道合作关系可能不会持续太久,但看孟繁岐怕麻烦的样子,总以为还有一两年。 没想到竟然借着自己的势头打起广告了。 这让他有些哭笑不得。 蓦地,又想起了王恺似乎已经申请离职,年前在办交接,这个月已经开始了。 “这小子不会是被王恺给说动了?” 李彦弘没来由地如此猜测,还真一不小心猜中了事实。 第117章 面试是个体力活 13年底,华国基本上还没有多少人工智能相关的岗位。 也就只有白度的人工智能研究院里的那些研究岗,算得上是正经的ai岗。 专业就更别提了,原本直到16-17年,才正式开设了第一批相关的本科专业。 等前两届科班人工智能专业的毕业生出来,时间都已经差不多21-22年了。 这个时间点互联网和人工智能市场都已经稍微有所冷却,迎来了相对的“寒冬”。 “不管是什么专业,等火了再去读,多半是来不及了。”孟繁岐报考电气的时候,待遇也还相当不错的。 只是等七年读出来,世间已经是沧海桑田。 而孟繁岐此时给出的岗位,便属于是十年人工智能浪潮最开端时的真正入场券。 由于急招的是ios和安卓手机系统相关的工程师,孟繁岐的招聘图片中,为相关的几个岗位直接标注了薪资待遇。 至于没有那么着急,但后面会需要的那些岗位,则是高文和律师准备拉一位搞人力资源的朋友进来,总揽这部分事宜。 孟繁岐作为纯粹的工程师,对外行管理内行的形式深恶痛绝。 因而他这里也只负责熟悉的技术人员招聘和定薪,其余的岗位还是需要专业人士去把控。 不过单就孟繁岐这个小初创公司给技术人员开出的价格,完全可以说是业内独一档了。 像之前米忽悠的三位创始人,尚海交大科班,在这个时节所能找到的最好工作,月薪大都在1万多2万多。 而孟繁岐为最初期的十名左右的成员,开出的底薪就在3万到4万左右。 五险一金等保障满格交,奖金和期权按贡献和实际成果另算。 “我超??税前一年五十万底薪??计算机现在这么赚钱了??” 这个在几年后的人工智能行业非常常见的待遇,此刻突然看到,其效果还是异常的震撼。 “我的老天,税前一年五十多万,光是交税就快比我年薪高了” “人家二十多岁给员工发五十万,我二十多岁一年赚不到五万” “学霸招女朋友吗?我萝莉音!”孟繁岐点开一看,性别男。 孟繁岐当然也清楚,此时招人,尤其是app相关的工程师,其实没必要开这么高。 开两万左右不是招不到人。 可他赚了这么多钱,又何必扣扣索索这一点呢? 要是重生赚了钱就把自己当资本家,那不就成了曾经自己最厌恶的那种人了。 孟繁岐的想法和三观还是正经的工人阶级,公司赚了钱,他绝不会吝啬给员工发奖金。 况且,所谓重赏之下必有勇夫。 前期的节奏紧,任务难度高,水平差一些的人来未必撑得住。 工资开得虽高,却也不是谁都有资格能拿到的。 毕竟第一批名额有限,孟繁岐也没有那么多时间全都投入在面试当中。 围脖的私信和围脖留的邮箱当中,已经逐渐开始收到简历。 孟繁岐大约筛选了一些,社招的必须要有app相关的项目经历,在校的可以放宽一点,不过学校和成绩要稍好一些。 由于孟繁岐没有给三个月实习期的工资打折,导致这个岗位对大四或者研三寻求实习的大学生们诱惑异常的大。 不仅尚海的几所名校投了许多简历过来,就连周边省市,甚至燕京那边都有不少简历过来。 孟繁岐对学历没有什么歧视,他更多的是以面试的考察情况来做判断。 只可惜简历投得实在太多,时间和精力上都不允许他每个都面试一番。 筛简历的时候,孟繁岐都有些不好意思了。自己一个普通211,现在完全是非c9经历连面试都不给。 你别说,这感觉真爽! 约了十几个尚海交大、复旦等高校的学生来漕河,又约了十几个京华和燕京大学的线上面试。 加上社招要来的那些人,可以说天的时间完全就进去了。 好在面试还在读的学生,倒也没必要每一个都单独去谈,孟繁岐基本是四五个一起,上来先做一道基础算法题。 开局先做题可以说是后来互联网不少岗位的标配了,这种题目跟岗位其实关系不大,考察的东西入职后基本用不到。 但针对大学生来说,确实是一个考察他们基本数据结构知识掌握情况的一个很好的办法。 孟繁岐出的题目也不是什么很困难的类型,此时刷题平台力扣即便在美也不算特别流行,距离进入国内更是遥遥无期。 考虑到国内此时的情况,面试所出的题目,孟繁岐大都控制在简单级别,偶尔有一两题稍微中等难度的。 “给你一个整数数组nus,判断是否存在三元组[nus[i],nus[j],nus[k]]满足i!=j、i!=k且j!=k,同时还满足nus[i]+nus[j]+nus[k]==0。请返回所有和为0且不重复的三元组。 注意:答案中不可以包含重复的三元组。” 这道题说人话就是一串数字里,哪三个加起来等于0,这属于中等难度题型里最容易的那一批。 比如说[-1,0,1,2,-1,-4],那就存在[[-1,-1,2],[-1,0,1]]这两组数字,三个加起来都等于0。 像这样要求简单易懂的题目,其实代码实现起来远远没有大家想象的那么容易。 或许根据这个例子,不少人可以很快做出符合要求的程序,可未必就能够兼顾到各种边边角角的特例。 “最简单的办法是三重循环然后哈希表去重,这个复杂度是三次方级别,就不用写了。” “呃”这话一出,好几个犹犹豫豫开始码代码的学生脸色一僵,又开始苦苦地思索。 有少数几个人却是噼里啪啦一阵狂码,孟繁岐去看了一眼,思路没什么问题,排序加双指针。 这题虽然不难,但是好的解法思路倒也不多,这一招算是标配。 孟繁岐再细看了一下,有两位同学的细节做得属实相当不错。 对枚举是否重合的判断,指针位置关系的确认,指针是否重合,还有循环退出的条件设置,都还挺仔细的。 这在力扣和面经没有流行起来的当下,挺难得的。 “算法的复杂度呢?”孟繁岐轻声询问道。 “时间是二次方,空间是logn。”夏彦是一个挺消瘦白净的年轻小伙子,小镇走出来的他家庭经济条件一般。 孟繁岐开出的价位是他从来未曾想过的,因此他对待这次测试格外认真,这是减轻家中压力的大好机会。 “是不是参加过icpc?这种题目对你来说太基础了。”a-icpc是一个规模很大的大学生程序设计竞赛,在这之中取得成绩含金量相当之大。 直到2023年,区域金牌基本上都是面试前三关的通行证。 夏彦羞涩中带着点骄傲地笑了笑:“和两个朋友一起拿过赛区金牌,他们两个今天也来了。” 第118章 钱够花吗 重赏之下,确有勇夫。 华国前四的院校来了好几个区域金牌选手,孟繁岐逐一再考察了一些进阶级别的题目。 即便是困难级,他们也很快有了思路。 虽然这些在校生没有实际的app开发经验,可此时的他们正是有冲劲的时候。 这些东西对他们来说,并不难学,摸索一下都可以很快上手。 都不用孟繁岐继续介绍后续逐渐可以兑现的期权又或者是什么奖金。 单就这一个月三四万的基础工资,他们就非常满意了。 赴汤蹈火,在所不辞! 社招人选里,其实符合条件的人不少,但不少都犹犹豫豫的。 毕竟这时节,能真的看懂并且all 人工智能的还是少数,就跟两年前敢囤比特币的性质差不多。 需要非常卓越的视野和坚定的意志。 几个决定来的,大都是因为看中了高薪,并且他们倘若辞职,交接上也得至少一个月。 唯有两位做app创业失败的工程师,可以迅速到岗,不得不说有时候确实是祸兮福之所倚。 谈了大约三四十分钟,孟繁岐觉得两位技术人员的水平还是比较过关的。 只不过创业的赛道选得确实差了一些,相机类的app受众虽广,竞争也格外的激烈。 更有不少手机厂家自己就在做这方面的事情。 这种小工作室自己想在相机类的app上做出成绩,没有十分炸裂的技术突破或者创意脑洞,恐怕实在是不成。 app做相机就像是新人写传统玄幻,都以为自己有了不得的地方,实际上根本无人问津。 “我个人认为,如果你想做的是人脸相关的编辑,完全可以结合相机app,而不是单纯只做一个编辑类的app。”朱雷和孟繁岐交流完之后,如此说道。 孟繁岐闻言一愣,有点摸不准他到底是说真的,还是单纯放不下自己想做相机app的愿望。 “你要这样想,人脸的照片哪里来?还不是要手机自拍,倘若这是一个相机app,拍摄之后马上就可以增加表情滤镜和年龄滤镜,用户的下载意愿肯定会高很多。” e他说的似乎稍微有一些道理。 比起某种年龄编辑又或者是表情编辑器,相机这个概念是更加贴近群众们的日常认知的。 “现在我有某种人工智能技术,可以编辑人类在图像中的年龄和表情。”和“我有个相机能把你拍哭,拍老。” 绝对是后者的受众更广,推广的难度也会更低。 “并且,我们的相机app在两个平台都有成品,我们只需要额外再接入这个功能就好。”很显然朱雷和姜杉不知为何对相机app有所执念。 虽然两人来到自己这里可能也是起了借尸还魂的心思,聊完孟繁岐的计划,发现他想要推出的功能依赖于人脸图片后,就狂推自己的相机产品思路。 不过他们的论点也有些道理,孟繁岐总体来说并不在意自己的产品形式是美图或者ps那样的编辑软件还是相机软件,只要它的门槛够低,并且具备人脸的编辑功能就好。 “他们说得的确也有些道理,前世后面的一些p图美颜软件,自己也都做了相机功能,什么轻颜之类的。如果只有p图,但拍照却要另外开相机,的确是增加了使用的成本,多了不必要的步骤。”孟繁岐如此思索着。 “那我就欢迎两位的加入?”孟繁岐起身和两位握了握手,他倒不担心这两位有什么别的心思,核心的那些ai技术都是自己一力承担,公司内并没有人懂。 相机app也只是一个载体,离了自己的核心ai技术,他们的相机产品毫无竞争力。 两位资深的相机app创业者,带领一群出色的大四\/研三的顶级高校计算机学生,孟繁岐最初期的app小队就此成立了。 “你们的任务也相当简洁明了,我会提供一个算法功能,对接收到的图片做一定的计算操作,返还一张特定属性被编辑过的图片。目前初版暂定是常见的一些表情,和年龄这两者。 用户需要传入的就只有图片,和某一属性的改动程度这两件事情。图片的计算在用户手机上是无法承担的,因此我们是在自己的服务器上进行这个运算。 考虑到用户的数量和使用次数,这很可能是个高并发的任务,你们先把相关的功能和接口给实现了。高并发这方面,我很快还会招一些系统方面的人来做。” 花了好几天时间处理这些琐事,孟繁岐感到有些心力交瘁。 自己创业果然还是比躺着分钱辛苦了许多。 好在初步搭建起团队来之后,需要自己操心的事情也没有那么多。 元旦前夕,终于闲下来的孟繁岐着手正式提交了一下斯坦福的入学申请。 虽然私下已经和学校达成了共识,但明面上的流程还是需要走一走的。 其中辛顿给出的推荐信也格外有意思,仅仅只有短短一句话。 “我推荐该学生去贵校攻读计算机科学,他是一名人工智能领域的天才。” 随后便是他的亲笔签名。 可能这就是业内教父级人物写推荐信的方式,一字值千金。 内容是什么根本无所谓,一点废话都不带,甚至只需要看那最后一个亲笔签名。 提交完申请资料没多久,孟繁岐就接到了李彦弘的电话。 “怎么样,数学家,最近在忙什么方向呢?”李彦弘打电话来当然不是为了寒暄,而是想要打探一下融资入股孟繁岐新公司的的可能性。 “目前是计划先做一个相机类的app。”孟繁岐当然清楚李彦弘无事不登三宝殿,既然对方不明说,那就跟他一直打太极,绕弯子。 “相机app?”李彦弘眉头紧皱,这下他彻底是晕了。他以为孟繁岐要搞ai创业,这相机app有什么可做的? 但出于对孟繁岐技术能力的信任,李彦弘最终还是没能绷住,以关心为名义,开口暗示了一下融资的可能:“如果有什么资金上的问题,随时联系我都可以。” “也就是先做一个简单的app试试水,要不了几个人。”孟繁岐心中暗笑道:“要是产品做出来有人关注,肯定少不了要跟李总合作。” 这倒也不是套话,白度现在和天网项目深度合作,孟繁岐可以接受白度入股一部分,只是比例会严格控制。 他不排斥稍微融一两次,不过不可能是如此早期。 因为资金他是完全不缺的,需要的更多的是平台和对方的人脉关系。 比如天网项目,通过白度的关系去切入,比自己一个个去找地方官员要快太多。 再比如企鹅和阿狸系的移动支付,如果不让两家稍微入股一部分,自己的人脸技术是没法在两个最大的移动支付平台上长久留存的。 不过即便有这个想法,在app有热度之前谈融资也太早了,现在能谈下几个钱? 那可太便宜他们了,这时间怎么也得往后拖一拖。 电话的另一端,李彦弘挂断之后心里也如明镜一般,知道这小子心里的算盘是想出成绩之后再谈价格。 “唉还是当时开价没开够。”李彦弘一厢情愿地如此想着,如果当时自己开出天价,说不定就真把他签下了,哪还有如今这么麻烦的事情。 他怎么也想不到,重生人士连谷歌的分成合约都是一年一签,又怎么会因为几个钱就一直给他卖命呢? 第119章 是收获的季节 2014年的1月上旬,正值辞旧迎新之际,孟繁岐手头的诸多事宜有快有慢,都恰巧在这个时间点上到了收获的时候。 重生归来之后,孟繁岐一直不确定自己这只扇动翅膀的蝴蝶,究竟可以改变世界多少。 自己之所以可以取得这些资本,创办这两家公司,完全依赖于这个世界的人无法观察到的另一个时空,这和“视界”这个物理意义颇有些类似。 并且,“视界”也与“世界”谐音,暗含了后续走向世界的决心。 因此,他将自己初次创办的两家公司,按照针对的技术方向分别注册为,视界视觉技术有限公司和视界智能医疗有限公司。 其中,智能医疗完全还只是空壳,暂时没有任何事情在推进当中。 而深度视觉这边,虽然相机app,相关滤镜、功能接口,和支付之类的功能已经在紧锣密鼓地准备。 可实际上,真正核心的模型部分却还在训练当中。 孟繁岐在自己的公司那边处理完起步初期的一些事务之后,再一次回到了谷歌尚海分部。 一方面是为了将推荐广告算法的后续两板斧挥完,二是为了验收一下自己的facegan脸部生成模型。 “我这算不算是公器私用?”孟繁岐还真说不清楚。 facegan是基于孟繁岐之前生成式网络的细分方向变体,主要用庞大的人脸图像数据集训练而成,其目的是为了针对人脸这一单一的元素进行逼真的生成拟合。 该技术目前并不具有非常强力的变现效果,一是因为所支持的像素还远远不够,二是因为想要达到足够好的效果,所需要的运算能力相当之大。 后续能够做到视频换脸,ai作画,各种图片的风格切换又或者是图片的高清修复之后,才具备实际商业价值。 因此,该技术将会是孟繁岐在与谷歌大脑签订合同之后,第一个贡献出去的正经视觉技术成果。 虽然该版本不具备很高的商业价值,可其所实现的功能很有象征意义,可以说已经给人类社会敲响了警钟。 在当初伊恩迟了孟繁岐一步,提出这个想法的那一天,本吉奥就已经预测到了类似的难题,不远的将来人们会开始面临和人工智能有关的伦理问题。 这些足以以假乱真的人工智能生成内容究竟如何监管,如何定义,如何限制又如何处理。 人类在这方面还是一片空白。 加州山景城,接到孟繁岐发来的facegan论文,辛顿顿时感到一阵宽慰。 前段时间他也听说了,孟繁岐在谷歌尚海专营推荐广告算法,捞钱去了,这让他非常痛心。 在他看来,这些捞钱的事情谁都可以去做,可孟繁岐的才能不用来推进人工智能,尤其是视觉智能,反而跟着广告团队去捞钱。 这简直就是暴殄天物,瞎胡闹!根本不像话。 可谷歌毕竟是一家商业公司,广告又是拳头营收产品。 辛顿作为雇员,于情于理不方便表达什么意见,只得作罢。 此刻看到facegan这个工作,得知孟繁岐还是在视觉智能上非常用心的,顿时老怀大慰。 “孟!好久不见!很高兴你在做推荐广告算法之余,没有忘记你的视觉算法!”视频电话拨通之后,辛顿喜悦表情溢于言表。 “我刚刚看完了你的论文,你的想法和操作非常巧妙。将生成器输入的随机噪声改为低分辨率版本的人脸图像,让生成器自己做上采样和微调修复。” 孟繁岐的生成式技术已经公布有两个多月的时间了,目前为止却还没有特别像样的跟进工作发表出来。 辛顿看了最为眼前一亮的,还得是gan作者本人,孟繁岐针对人脸的这一系列操作。 “生成网络变种的潜力还是非常大的,我这次除了在结构和组件上做了一些微调,也对计量损失的函数稍微做了一些修改,增加了对抗损失以鼓励生成器做出高分辨率的人脸去欺骗判别器。” 孟繁岐和辛顿深入交流讨论了一番,但都是“生成”这方面的内容。 gan系列网络的另一个强大的功能,“编辑”,孟繁岐则故意没有去提及。 这部分将会是相机app这几个月的首要买点,孟繁岐并不希望节外生枝。 由于时间的关系,他没有那么多精力做非常详尽的对比测试,并做出网站发布。 细致的实验部分,以及[这些人都不存在]这个假脸生成网站,都被委托给了谷歌大脑团队的其他同事去做。 隐而未发的隐藏层编辑功能,则和模型一起交给了自己的视界公司那边,如此一来明天就可以有一个最初测试版本了。 “你又做了两版推荐广告算法的更新?”周桓假期回来见到孟繁岐,招呼还没打完呢,就听到了一个让自己下巴掉在地上的消息。 “上回那个夸张的结果我到现在还没能消化完呢。”陈灰在旁边有些酸溜溜地说道,真是人比人会死啊。 自己两人圣诞连着元旦过完都还没能从先前的震惊当中缓过神来,这小子倒好,又带来两枚重磅炸弹来了。 “这回不会又闹个鸡飞狗跳?”周桓还记得上次的更新全部上线之后,虽然营收是增加了,可由于流量惩罚的打击面太广,相关的一些客服辅助员工全都被累爆了。 有不少缺德的垃圾场网站成员,装作无辜的样子不依不饶,非常折磨。 “这次还好,移动端的优化基本上是润物细无声的。语言理解方面也只是为了给用户更好的搜索体验,影响不会像上次那么大。” 谷歌和白度目前的搜索模式,只是机器无法理解语言含义的临时产物,过渡产物。 有点像电话发明前的电报,电话发明前曾有很多人觉得“电报已经足够好了,没有人会用电话这样的东西”。 但电话才更接近人们的真实需求。 搜索引擎也应该逐步拥有智能,而非只是机械性地检索用户输入的一字一句。 例如,相同的关键词在不同的语句和语境当中含义完全不同,这个现象在中文中尤其严重。 早期互联网用户在搜索东西的时候,经常使用几个关键词加空格的方式,就是因为搜索引擎无法理解长句。 如果你的句子太长内容太多,搜索出来的东西反而杂乱异常,或者干脆搜不出来。 不过现在一切都不一样了。 有了这个雏形的t方法模型,搜索引擎不但可以处理长句。 并且还可以非常好的处理那些,一字之差,含义天差地别的情况。 当然了,那种一个字都不需要改变,却又多种意思的,仍旧比较难办。 比如[喜欢上一个人]就有至少四种截然不同的含义。 第120章 AI相机上线 第121章 时间刺客 第122章 轩然大波 1月上旬,视界视觉技术有限公司的第一款产品,ai相机正式上线投入使用。 时间刺客,假笑表情包之类的哏很快流行起来。属于自来水,热度不低。 孟繁岐在这件事情上没有投入宣发经费,只是和李彦弘做了一笔交易,换来了当前时间点如日中天的91手机助手的推荐资源,以及李彦弘后续在政府项目上的人脉支持。 作为彼时拥有百亿级别下载次数的手机应用平台,91的支持让ai相机的起步之路可以说是平步青云。 而孟繁岐为此付出的代价则是一个承诺,答应在这个月内和白度确定一次融资。 李彦弘并无所谓要控制视界视觉技术多少的股份,又或者是从中赚取多少的利润。 在他的视角当中,只是要通过持有孟繁岐的公司的股权的方式拉进双方的关系,在他看来,这对以后白度的ai技术很可能会大有益处。 为此,他宁可以白度的股份去和孟繁岐的这个初创小公司股权做交换。 孟繁岐的app李彦弘看了,所谓的相机不过是一个载体,提供给用户一个不用换app就可以拍照的选择。 真正的重点不在于此,而是在于: 这个将照片中的人物返老还童,又一夜白头的功能。 这个让照片中的任务喜极而泣,又破涕为笑的功能。 隐藏在app背后的ai算法,让懂行的李彦弘大为震撼。 此时距离孟繁岐发布生成式对抗算法其实也仅仅只有两个多月的时间。 这段时间里,白度落地了yolo实时检测算法,并且与政府取得了合作。这件事的进展已经相当顺利,可以说是飞速了。 可孟繁岐这边,则是直接将生成式模型从一个开创性的设想,变为了一个强力可控的编辑工具。 直接对任意图像中的人脸,随心所欲地编辑其特定属性。 年龄和表情只是非常初步的尝试,只是诸多可能性中最简单的几种罢了,可以说是九牛一毛。 如果孟繁岐已经找到了办法通过人工智能算法去修改图像的某种属性,那他可以做的事情实在太多了。 图像的智能上色,人物的衣着姿态更换,缺失部分的弥补,图片整体风格的调整。 甚至直接从头凭空生成。 如此多的可能性,只要他愿意投入,不需要太久的时间就可以做到。 自从认识孟繁岐之后,李彦弘在人工智能这个领域取得进展的同时,又深深地感到无力。 白度在人工智能上每年大几十亿的投入,所取得的成就与孟繁岐这几个月的进展相比,完全不是一个级别,只能每次都追在后面研究孟繁岐的论文和代码。 就在前几天,政府在天网项目顺利推进之余,政府方面已经提出了自己下一步可能需求的技术。 那便是基于庞大人口基数的人脸识别系统。 在政府的计划当中,有一个中长期的需求,又或者是愿景。 那便是希望能够通过简单的图像\/视频的方式,直接将观察到的人选与居民的身份信息关联起来。 比如在海关这样的地点,人脸识别+大数据可以使得警方人员拦截关键人员的同时,让普通游客毫无感觉地顺畅通关。 又或者是在公安这样的部门当中,比较快速地在数据库中检索一些关键人物的面部照片。 李彦弘才刚刚开始思索这方面的事情,孟繁岐新公司就已经做出这个明显带有一些炫技的性质的相机app。 在人脸这件事情上,编辑各种属性已然举重若轻,显得毫不费力。 app发布不到一周的时间,有了破千万的下载量。 虽然很大程度上依赖了91手机助手这个平台和宣传资源,但从用户的留存和活跃行为来看,app本身的质量是相当过硬的。 破千万的用户数量只能说是不温不火,想要成为现象级别的app,怎么也得大几千万,乃至过亿的用户量才能称得上。 但是即便不算很火,最初的那点服务器肯定是早就不够用了。 好在正如高文和所说的那样,谷歌在2013年末结算了一部分分成金额过来,孟繁岐很快又跟进了一批设备。 饶是如此,孟繁岐也不得不极大地压缩额度,开启付费使用的模式。 毕竟做app也不是做慈善,那么些显卡一直运转,费用也是不低的。 孟繁岐的定价不高,非常良心。 积少成多,慢慢也有了上百万的进项。 加入创业团队没多久,就有了产品也有了营收,夏彦等几位仍旧在读的学生是兴高采烈。 虽说这点钱还不够老板回本设备的,就更不要提场地的购买费用了,可这只是一个开始!好日子还在后头呢! 还在办理离职前交接手续的王恺则是泪流满面,孟繁岐明明说得是过两个月,怎么动作这么快! 再这样下去,他就连汤都喝不到热的了。 app的用户突破千万后,增长的速度就减缓了许多,这个情况比预期的要糟糕一些。 不过原本它也不是主菜。 一月中旬的时候,谷歌通过了内部审查,发布了孟繁岐的facegan脸部生成技术论文,以及[这些人都不存在]网站。 这件事情引起的反响远远超过了孟繁岐的预期,就在24小时之内,事态彻底脱离了孟繁岐的掌控,甚至于谷歌的掌控。 孟繁岐重生大半年以来,已经发布了多项世界级的技术突破,但在美国的热度均止于圈内,称不上是什么社会事件。 可这次,不知为何,全美的知名媒体均在24小时内就对这次的技术做出了反应。 其中包括华尔街日报,纽约时报,福布斯n等多家大牌知名媒体。 孟繁岐快速地浏览着这些媒体的报道,心中掀起了滔天巨浪。 “我超?为什么反应这么激烈???” 在孟繁岐看来,目前的脸部生成技术还远远逊色于后来可以作用于全身的视觉技术,换脸又或者是fake系列。 他终究还是低估了提前的技术对当下的人类到底能有多震撼。 作为第一作者的他,在推特上现在已经被爆了。 记者,学者,吃瓜的百姓,还有愚昧的被煽动者。 此刻的孟繁岐就处于舆论风暴的最中心,讨论的最焦点。 而ai\/人工智能这个专业领域,在孟繁岐的多次推动之下,也终于由量变引发质变,成为了社会性的话题。 第123章 针对性报道 “就在昨天,谷歌发布了最新的人工智能技术facegan。 于此同时发布的,还有一个叫做[这些人并不存在]的网站。 或许观众们会觉得这是一个彻头彻尾的恶作剧,因为这些肖像,这些人物看上去是那么的真实,栩栩如生。 可爱的幼童,美丽的女士,英俊的绅士,历经沧桑的老人。这一切似乎与我们生活中的人物没有任何不同。 但事实证明,这些图像并不是真实拍摄而来,而是使用最尖端的人工智能技术生成获得的。 对此,我们应当感受到深深的担忧。 facegan是两个短语,face和gan的组合。其中gan是两个月前,由华国年轻人工智能学者,孟繁岐提出的生成式对抗网络。 这是一种创新的人工智能方法,gan在两个月前,还只是领域内开创性的一个设想。 但两个月之后,针对人脸任务的facegan就已经展现出了惊人的生成效果,威力无穷。 按照这样的发展速度,我们有理由相信,任何拥有计算机和互联网的人都可以创建逼真的照片和视频,展示人们在说和做他们实际上没有说或做的事情。 荒谬绝伦的事情都有可能会拥有[证据]佐证。 尽管令人印象深刻,目前的facegan技术仍旧暂时无法与真实的高清照片相提并论——通过仔细观察,通常可以分辨出该相片是人工智能生成的。 但这项技术正在以惊人的速度进步。专家预测,用不了多久,人们将无法把人工智能生成的内容与真实图像区分开来。” 这是福布斯的报道,总体来说还算是中肯。 虽说对后续人工智能发展的速度过分乐观了一些,不过这属于外行人犯了也很正常的错误,完全可以理解。 n那边,报道的画风就完全不一样了。 尤其是其中这一段,攻击性非常之强。 “类似的生成技术将被广泛应用的第一个用例——新技术通常就是这样,不论你愿不愿意——都将会是涩情内容。 而生成式涩情内容几乎都必定是非自愿的,从网络的一些黑暗角落,这样的生成式技术会逐渐从涩情领域蔓延到政治领域,并造成更大的混乱。 如果可以向所有人展示他们认为是[真实的]虚假内容,那么不需要太多想象力就可以理解可能造成的危害。 想象一下政客在选举前参与贿赂或性侵犯的生成式伪造镜头;或美国士兵在海外对平民犯下暴行;或奥观海总统宣布对朝鲜发射核武器。 在这样的世界里,即使这些片段是否真实存在一些不确定性,后果也可能是灾难性的。 由于这项技术的普及,任何人都可以制作这样的镜头:国家资助的演员、政治团体、独立的个人。 扭曲民主话语;操纵选举;削弱对机构的信任;削弱新闻业;加剧社会分裂;破坏公共安全;并对包括民选官员和公职候选人在内的知名人士的声誉造成难以修复的损害。 在过去,如果你想威胁美国,你需要10艘航空母舰、核武器和远程导弹。 今天你所需要的只是制作一个非常逼真的假视频的能力,它可能会破坏我们的选举,这可能会使我们的国家陷入巨大的内部危机并深深地削弱我们。 这些事情,就在不远的未来。 如果我们不能相信从世界各地收集到的视频、音频、图像和信息,那将是一个严重的国家安全风险。 图像和视频是否真实几乎无关紧要。强力的生成式技术将使公众越来越难以区分什么是真实的和什么是假的,政治参与者将不可避免地利用这种情况——这可能带来毁灭性的后果。” 孟繁岐读到这里的时候人都快麻了,怪不得川普最喜欢n是假新闻(fakenews)。 这比话说的就特么离谱,现在就只是对低分辨率的脸部图像做了个生成技术,就n说得比航空母舰还邪乎了。 什么过去需要“10艘航空母舰、核武器和远程导弹”,现在只需要制作假视频的能力? 意思是他孟繁岐再搞两年人工智能,就智械危机,拿下美国了是。 正经的东西是一点不讲,技术内容也完全不提,就光顾着贩卖焦虑了。 看得孟繁岐血压都高了。 华尔街日报的报道则最为技术一些: “使得生成如此逼真的图像成为可能的核心技术,是生成式对抗网络,它是由孟繁岐在2013年10月公布的。 人工智能界的教父级人物,辛顿和本吉奥均高度赞赏这个想法,并称它为过去十年内最有趣的想法。 在gan出现前,神经网络擅长对已经存在的内容进行分类,语言,语音,图像等,但完全不擅长创造新的内容。 孟繁岐不仅赋予了神经网络感知的能力,还赋予了它创造的能力。 孟的概念突破是使用两个独立的神经网络构建gan——一个称为“生成器”,另一个称为“鉴别器”——并将它们相互对抗。 从给定的数据集(例如,人脸照片的集合)开始,生成器开始生成新图像,这些图像在像素方面与现有图像在数学上相似。同时,鉴别器被输入照片,而没有被告知它们是来自原始数据集还是来自生成器的输出;它的任务是识别哪些照片是合成生成的。 随着这两个网络反复地相互对抗——生成器试图愚弄鉴别器,鉴别器试图证明生成器的创造力——它们磨练了彼此的能力。最终鉴别器的分类成功率下降到50,不比随机猜测好,这意味着合成生成的照片与原始照片变得无法区分。 而我们现实当中的情况也是如此,一旦我们发现了某种足以识别生成式虚假内容的方式,生成端很快就可以修正这些内容。就像是猫鼠游戏,我们未来与生成式虚假内容的对抗,就像是gan方法一样,会不断促使生成模型变得更强大。” “我超,这是纯纯的哲学家啊。”孟繁岐看完之后心头一震,这最后的升华是他自己也没有想到的。 在推特上又逛了一圈之后,孟繁岐才知晓为何这次技术突然引发了这么多人的关注。 原来是有行为艺术家,看了[这些人都不存在]网站后,从上面找了几张图当头像,直播去网聊。 结果跟他对话的人,有不少都评价过这些图像,但均没有一个怀疑过这些图像的真实性。 在数百万吃瓜群众的围观之下,facegan的实力被抬到了一个不属于它的高度。 而作为gan技术和facegan技术的第一作者,孟繁岐如今在推特上炙手可热。 无数的问题和让他眼花缭乱,甚至发文的这几家主流媒体,也纷纷通过推特留言或者谷歌的关系,对孟繁岐发起了采访的邀请。 第124章 舌战群儒 人工智能属于比较前沿的科技学科,即便是后来比较出圈的情况下,普通人大都是了解一下用法最多了。 没有谁有那么多精力去探究其中的原理,技术的实际意义又或者是各种社会影响等比较高深的内容。 在现在这么早期的时候,就更别提了,即便是领域内学者其实都没能来得及仔细阅读一下孟繁岐facegan的论文内容。 这些媒体能懂得什么?而被媒体忽悠带着走的普通民众就更闹不明白了。 媒体之间自然也有高下之分,如华尔街日报和纽约时报,本次报道的内容就显得比较专业公允。 在介绍情况的同时科普了技术内容,知识背景,算是比较负责的媒体行为。 福布斯带上了许多脑补吹嘘的成分,不过总体情有可原。n则是完全就是在打煽动,掌握流量密码,让人观感非常不好。 “我给出的不少例子分辨率才几百n的危言耸听也太有想象力了一点?”孟繁岐现在心情非常不好n全程是美国有线电视新闻网,并不是什么小媒体自媒体。 考虑n后来一直持续带着偏见报道任何与华国有关的事件和新闻,如此带有偏向性和恶意的报道,有极大的可能是故意为之,因为国籍针对自己这个技术发布者。 “我目前还未赴美,在美国的媒体上也从来没有发表过什么观点。”孟繁岐检查了一下自己的社交账号记录,倒不是他怀疑自己有什么问题,而是口水仗之前的准备工作。 有备无患。 除n明显带有偏见的新闻稿件之外,孟繁岐还注意到其旗下的一名评论员杰克-卡弗蒂则在推特上兴风作浪,鼓动了许多民族主义者来对孟繁岐进行各种形式的人身攻击。 其中呼声最大的论点无非就是一个主旨,“那就是这些移民都很坏,他们都要害美国,他们都要害美国人。” 非常愚蠢的一群人。 孟繁岐可不会惯着这群愚蠢的白人,他很快编辑了一条推特。 “为什么今天有那么多人说我是移民?一,我此生并没有改变国籍的计划,我生而为华国人,那就一辈子是华国人。二,如果你不是印第安人的话,显然在美国的土地上,你们才是移民。所以,fxxkoff!” 孟繁岐的回应推特就像是水下油锅,整个场面彻底炸开。 很显然,孟繁岐的话直接指向了他们最不愿意提及,却又无法否认的事实。 那就是这片土地原本属于美洲的印第安人,是那群白人鸠占鹊巢,少在这里自鸣得意了。 “你是华国人,那你为什么要说我们的语言?”被说得跳脚之后,许多人强撑着继续在孟繁岐的推特下对线。 “你跟我说英文是因为我会说英文,我跟你说英文是因为你只会说英文,我们之间的层次实在差得太多了。” “你xxxxx” 孟繁岐摇头叹气道:“又是一个急得只会打脏字的可怜虫。” 他发觉美国网民真的很奇怪,他们似乎对一些显而易见的事实毫无抵抗力和承受能力。 这不都是明白着的事情吗?怎么自己说出来他就急了? “你将会影响我们的政治,我们的国家,甚至我们的宪法!停止这么做!” “事实上,是有人会用我的技术对这些东西造成一些影响,它对你们来说就像是枪一样,具体还要看谁去使用它,又用它做了什么。可不论如何,都不该怪罪到我这个普通的技术发明者身上。你在被枪杀的时候会去怪汤姆逊和马克沁吗?动动你的呆瓜脑子!” 孟繁岐回应完这件事,那可就更热闹了,要知道持枪,和给与持枪法律基础的宪法第二修正案,一直以来都是美国的政治正确。 “你怎么敢!” “我只是单纯在表达,技术和枪其实差不多。你们排斥这种新技术的态度,就像是我要修改宪法第二修正案。” “闭嘴!你不能说修改宪法第二修正案!”这是有爱枪人急了。 “为什么不能,它的名字就叫做修正案。你知道修正案是什么意思吗?它是宪法的修订版。它本身的存在就意味着一次对宪法的修改。如果不能改,又怎么会有修正案?哦天呐,或许你们比起宪法,更需要的是一本字典,好好去查一下。” 孟繁岐在网络论战上可不是什么新手,即便在祖安,他也是排得上号的好手。 专门抓着这群白人的痛点说,了无痕迹地转移了话题。 “这帮人还是这样,那么几个话题一提就炸,反反复复争来争去,也不嫌累。” 这些网络谩骂,他根本就没往心里去。 前世日子不好过,生活那么累的时候,这种网络对战他都没有放在心上。 现在钱也不缺了,又怎么会在意愚昧的美国人到底怎么看自己? 之所以没有克制自己,正面做出了反击,也不过只是践行美国宪法的第一修正案,维护了自己言论自由的权利罢了。 如此强硬的回复并不是一时冲动,而是美国这个地方玩法不太一样。 做一个推特红人挺好的,过几个月在美如果开公司,自己本身就可以成为广告招牌。 比如马斯克,整天推特玩弄股市和币圈。 今天宣布特斯拉接受比特币,明天接受狗狗币,后天又是一手抛售。 川普就更别说了,直接推特治国。 其原因也很简单,美国的主流媒体有自己的想法和目的,不会如实地阐述事实。 在这样的情况下,跑到公共平台成为一个知名度比较高的[网红]可以有效规避这些被主流媒体曲解扭曲的风险。 比n就显然对孟繁岐的技术很不友好。 不过推特这样的平台也不大可靠就是了,即便贵为美国大统领,川普也在后来被推特禁言封号。 可以说喜剧效果十分惊人了。 “或许我需要一个自己控股的社交平台。”孟繁岐开始思考起这件事情来,此时此刻的比特跳动是一个不错的选择。 开始获得谷歌广告收益的他,在二三月份的时候会有三个多亿美金的新一轮分成,在这个时间点上,大约一亿美金可以分得比特跳动20-25的股权。 而比特跳动的产品,tiktok后来在美极其流行,非常符合他的需求。 如果时机合适条件成熟,自己在美先做tiktok也是个不错的主意。 第125章 要辩就来! 孟繁岐在推特上n那一派民众的强硬态度,出乎了几乎所有人的意料。 这种绝不任由攻击,强硬回复,深谙美国那些破事,而且同时又那么敢说的华人,在他们看来确实比较少见。 不仅是美国方面关注到了此事,国内也有不少人投过来了一些视线,并觉得这个年轻人非常有意思。 其中咖位最大的,就是去年刚刚担任华国外交部部长的王义。 王部长走南闯北,见得多了,西方的哪一个国家他没去过? 全华国也没有几个人比他更清楚,部分西方媒体是怎样的尿性。 嘴上都是民主自由,但实际上从头到尾都是资本和利益说话,最基本的新闻素养都没有。 这种又当又立的姿态,尤其难堪,令人作呕。 孟繁岐对后来有一个片段印象特别深刻,川普任美国大统领期间,曾经在有一次会议上说道:n的记者没有我的允许不能提问。” 结果那个记者回去就写道:“川普大统领把我赶了出来。” 这在任何意义上都是相当炸裂,违反了最基本新闻原则的,压根就是睁着眼睛说瞎话了。 而王义部长,则频繁需要面对这样不怀好意的媒体询问。 由于身份的关系,许多话王部长完全不合适去说,许多态度也不方便去表达,大部分时候最多也只能绵里藏针,不好搞得太下不来台。 不过你别说,看到年轻后辈狂n无良媒体人,感觉还真挺爽的。 “哈哈哈哈!这个年轻人还挺有意思,也算是师夷长技以制夷了,非常擅长用老美的那一套去驳倒老美。” 茶余饭后,王义部长在与同僚闲谈的时候,提到了这件事情。 “王部长怎么也关注到他了?”梁发明多年前就和王部长相识。 但由于他在公安部门工作,王部长工作性质经常驻外,两人相见的机会不多:“我们郭部长最近有意向推动智慧公安,这方面不少关键性成果都是他做的。” “真的假的?”王义眉毛一抬,说实话,人工智能那一大堆东西他没太细看,也没看明白。 只是觉n那一批媒体在危言耸听,人工智能这东西发展哪儿能有那么快? 看这小伙子把对面怼的一愣一愣的还挺爽,至于其中的技术内容到底是什么水平,他还真不大清楚。 “那还能骗你不成!”梁发明又再分享了一些细节,“现在我们那个天网的检测功能,基本上就是他一力贡献的核心算法部分。” “现在郭部的意思是,希望做好关键枢纽的人脸智能检测,这事本来都有些眉目了,现在看来怕是没戏了。” “为什么?”王部长边吃边问。 “这不是搞出什么虚拟生成技术了吗!原本好几家企业提供了人脸识别算法,效果都还不错。结果新技术出了,我们测试了一下,完全真假不辨,这里面的安全隐患太大了。” “哈哈哈哈,所以他技术做得太好,反而搞得你们没法继续推进下一步了?”王义哈哈大笑,这小子怼美国人有意思,搞出的事情也挺有意思的。 从来只听说技术不够好做不了,没听说过技术做太好,反而搞不了的。 “那问题就来了,你们有没有问过他能不能解决这个问题?”王义这一下,可把梁发明给问住了。 他们也只是根据汇报的测试情况,判断现在的人脸识别算法无法投入如此正式的场合使用。 倒完全没有想过,去询问做出了这个技术的孟繁岐有没有办法。 孟繁岐其实计划最近尝试联络政府方面来着,但是他这段时间的事情实在太多了一些,就耽搁了。 除了被王义部长闲暇时的闲聊点醒的梁发明,此时此刻想要联系孟繁岐的人实在太多,原因也五花八门。 其中最着名的两位,一是阿狸系的掌门人马芸,二是特斯拉的掌门人马斯克。 还差一个企鹅系的麻花藤,这就三马齐全了。 马芸一直希望推进一种比密码更加快捷但同时兼顾安全性的支付方式,这可以让支付宝的便捷程度再上一层楼。 目前,也有两种比较流行的办法可以在手机上做到类似的效果,那就是指纹识别和虹膜识别。 可并不是所有手机都有这样的功能,但所有的智能机都有摄像头。 这就显得有摄像头就能用的人脸识别算法格外的通用方便。 马斯克那一边,则是因为自动驾驶的视觉技术。 特斯拉推动自动驾驶项目很早,13年五六月份就已经投入了不少的资源。 在过去的半年当中,孟繁岐开源的drea残差网络让这个项目的进展有过一次小的飞跃。 马斯克其实也看了推特上的论战,混乱中立的他看热闹不嫌事大,觉得孟繁岐的应对非常有趣。 原本没有非常着急的他,在这一事件之后反而主动联系的孟繁岐,询问他是否有兴趣为特斯拉的自动驾驶系统专门设计一个网络结构,以取得特定硬件上更加优异的性能。 “我闲的时候你们是一个不来,我一忙起来,你们是接踵而至啊”马芸马斯克要谈业务,李彦弘要谈融资,政府方面来人询问有无识别技术,谷歌方面则要谈一下公关应对。 自己咔咔咔一顿怼完nn的评论员卡弗蒂还要约自己上节目论战。 其他咖位再低一些的人,更加是数不胜数。 第一次有如此高的关注度和热度,孟繁岐的大脑飞速旋转,却仍旧有点应付不来,忙不明白了。 “看来我是时候配备一个秘书了啊。”以前还想不通为什么政府领导,公司高层都要配备一个秘书,这回算是弄明白了,自己是真忙不过来,精力用在这些事情的协调,日程安排上实在太浪费了。 忙虽然忙,却是稳中向好,忙并快乐着。孟繁岐心情大好,直接给第一批员工们发了一个月奖金。 众人大呼老板大气的同时,也是头一次有如此神奇的体验,入职没到一个月,工资还没轮到发呢,先给发了一个月奖金。 与几个重要人物另外约了时间之后,孟繁岐也懒得继续在网络上n那批如此有偏见的人再多费口舌。 只留下简简单单的一句话,“以你的智商,我实在很难留言跟你解释清楚。现场直播,要辩就来!” 这可是送上门的广告机会,孟繁岐怎能错过? 第126章 世上最速亿万富翁 卡弗蒂和孟繁岐的直播对谈在三天之后,这件事情在全美的热度还是比较高的。 主要是因n用情绪的方式,牵扯了太多美国民众关心的元素进来。 什么隐私,政治,权益等等。 全美公众现在对孟繁岐的标签,是口无遮拦的ai技术狂人,评价褒贬不一。 这里面有一定的误会,不过孟繁岐并不在意,也不准备去解释什么。 大部分人对此事持有的态度是围观,好奇,不过也有少数人员显得异常兴奋。 其中最为积极的人,孟繁岐怎么也没有想到,他会是谷歌的前ceo,施密特。 作为谷歌这个硅谷巨物的前任掌舵人,施密特不缺钱,也不缺人脉。 可比较遗憾的事情是,在他个人的一个兴趣之上,却始终无法得到满足。 那就是做一档国民级的电视节目。 施密特自从退休之后,曾经数次起了要做脱口秀节目又或者是谈话节目的念头。 他曾经拉到过着名制作人麦奎克合作,希望成n一档脱口秀节目的主持人。 不过非常可惜n的内部人员评价他录制的节目内容为“彻头彻尾的灾难”。 此前还有一次,在某一档节目当中,施密特大放厥词:“如果人们不满意谷歌街景服务将其照片发布到网络上,那么就搬走。” 这样不谨慎的言辞,使得美国的各大电视网络都不愿意选择施密特做主持人。 施密特从11年开始,大约花费了两年多的时间试图进入电视行业,可至今仍然没有任何的水花。 不过孟繁岐这次事件,似乎成为了施密特电视行业的一次转机。 如今处在风头浪尖上的生成技术和算法发布者,都与谷歌有关。 而谷歌方面,有足够这方面情报的人,比如杰夫,辛顿还有两位创始人,都不愿意出面接受采访。 如此一来,施密特就成为了唯一的选择。 “您好,施密特先生。我们今天有幸与您对话,来谈论google在人工智能领域的最新技术突破。首先,我想问一下您对这些技术突破的看法。” “facegan网络是极为令人兴奋的一项发展。该技术的研究非常具有潜力,可以用于更深入地理解面部影像,生成更逼真的虚拟影像。甚至在未来,我们可以对面部特征的多个方面进行图像的改编” 施密特为了自己的电视梦,还是下了一番苦功的,把相关的一些技术词汇和概念准备得滚瓜烂熟。 聊了一些相关的内容之后,主持人直接将话题引到了技术的提出人,孟繁岐身上。 “所以,请描述一下,施密特先生。孟到底是一个怎样的人?” “他是一个彻头彻尾的天才,虽然我在现实当中还没有与他直接对话过,但我可以说,他的才能远远不止在图像相关的领域当中。” “哦?方便透露给我们吗?”主持人听到这个,来了精神。“具体指哪些方面呢?” 之前例行公事的无聊内容谈论了太多,到现在才总算聊到一些正经的料。 “全世界现在大约有两千多名亿万富翁,他们可以说是精英中的精英,吸金赚钱的速度令人咋舌。 虽然现在财富的数字远比过去要大很多,可想要赚到手十亿美金,仍然不是一件简单的事情。” 施密特没有直接回答问题,毕竟这涉及谷歌的核心营收业务。 他饶了一个弯子,没有明说具体的技术方向和内容,只是暗示孟繁岐的技术成就已经突破十亿美金之巨的身价。 billion一词,意为十亿。亿万富豪并不一定非要赚够十亿,许多数亿身价的人也可以此自称。 但施密特并没有使用billionaire(亿万富翁)一词,而是确切地暗示孟繁岐已经攫取超过十亿美金。 “holyshit!你是想说孟繁岐已经凭借技术突破了十亿美金的身价?”主持人当场就有些坐不住了,facegan显然不是现阶段可以有天价营收的技术,如此一来,似乎孟繁岐目前展现在公众面前的价值还只是冰山一角。 “这里面有些事情我不方便说太多,不够我可以透露的是,全球的十亿美金俱乐部会迎来史上最年轻的一员,也是最快达到这个标准的一员。” 施密特传达出去的信息还是留了许多余地,比如他并没有透露非常具体的数字,也没有透露孟繁岐分到这些利润所用的时间。 若非如此,震撼的程度还会再提升数个等级。 很多人可能对这样大金额的数字没有概念,这也是为什么前世经常会有很多还在读书的魔怔人,说自己喜爱的游戏动辄营收几百亿美金。 实际上,别说是十亿美金,即便是一亿美金现金,在美国也已经是笑傲群雄的存在了。 面对孟繁岐的技术突破,谷歌也不是随时就可以拿出这么多现金来给他分成,而是需要借助股权,资产等其他形式。 真正十亿美金的富豪,全美一共才500个左右。 像英国,rb这样的国家,单人资产过十亿的仅仅只在30-50人左右。 再弱一些小一些的国家,即便是沙特阿拉伯,阿联酋这样以土豪闻名的国家,过十亿美金的也不到两位数。 如此一来,倒让主持人一下子理解了为什么孟繁岐在推特上对待那些恶意的评论时,态度显得那么牛气了。 “我要是20岁出头就赚了十个亿,我特么不比他再牛一百倍?我直接骑在这群蠢货头上!” 不仅是数字惊人,施密特暗示的一年左右时间,这个速度也同样惊世骇俗。 美国现在互联网届那些知名的大咖们,比尔盖茨,花了十多年。谷歌的两位创始人,布林和佩奇,七八年的时间。飞速崛起的脸书,扎克伯格也花了四年左右的时间才迈过这个门槛。 虽然有通胀的因素在里面,现在的十亿没有当年含金量那么高,可这个速度也绝不是开玩笑的。 施密特借助这个争议和热度过了一把电视瘾,孟繁岐却因此感到不大愉快。 俗话说财不外露,更何况这所谓的上亿美金,距离拿到自己手里至少还得一个季度。 钱还没到手,就被拿去在国家级电视上当吹牛的谈资,这让在经济上想低调一点的孟繁岐前功尽弃。 不过此时的孟繁岐,根本没有时间去有什么情绪。 生成式技术的反响如此空前,它的安全性问题也被过分地强调到了如此的境界。 此时正是发布自己人脸检测算法的最佳时机。 如果自己发布的生成式内容可以被这个新算法完全地检测,此前所谓的危机也就不攻自破,被化解大半了。 第127章 真假难辨 空前的热度意味着绝佳的广告机会。 孟繁岐此时正在自己的公司紧锣密鼓地测试新人脸算法的性能和对生成式假脸的识别成功率。 原本这件事情只需要做得差不多就好,可现在生成式内容的安全性问题被高度关注,在这方面容不得任何一点闪失。 在孟繁岐对自己的算法效果精益求精的同时,世界各地的人脸识别团队都在苦思冥想当中。 机遇和挑战并存,整个人脸识别方向虽然面临着真假难辨的巨大难题,但只要解决了这个问题,带来的益处也是同样巨大的。 这种安全性隐患是势必需要解决的根本问题,可以说谁能够解决这个问题,谁就掌握了核心科技,能够先人一步摘走最大的果实。 脸书的deepface团队,刚刚根据孟繁岐的几个新数据迭代了一轮,还没能从取得了几个关键提升的喜悦中缓过神来,就直接遭遇了重大危机。 几兄弟人都麻了。 前一秒还觉得孟繁岐是自己团队的大救星,现在则整个反过来,觉得孟繁岐是团队的究极大仇人。 “这个鸟人怎么技术突破搞那么快”杨明深深叹了一口气,自己这边一个专注人脸的四人团队,做起实验来轻车熟路,分工合作更是亲密无间。 怎么每次接近可以发布的时候,就老被这个鸟人打断节奏。 上回是骨干网络的革命性突破,导致几人不得不重新迭代一轮实验,以确保自己技术的地位。 现在倒好,不搞突破了,直接换了一整个赛道,给你整了个革命性的安全问题。 这下倒大霉了,直接变成了这技术还能不能用的问题了。 把一整个赛道整没了。 “我们的算法识别生成式假脸的准确率怎么样?”沃夫问道。 “这个要看情况了,主要看你到底有多少比例的假脸给它看。” “此话怎样?”沃夫愣了一下。 “因为反正它都会认为所有的脸都是真的,因此你如果一张假脸都不给它看,准确率就是百分百,你要全给它看假脸,那就一个人认不出来。” “还在贫是??”沃夫脸一黑,什么时候了还在这抖机灵呢。 “唉如果不能解决安全性问题,公司短期内商用人脸视觉算法的计划就要推迟成为长期了。” 沃夫人也麻了,短期商用计划变长期,直接意味着他们四人组的价值和地位打骨折。 研究人员本来不说指望这这一波走上人生巅峰,好歹也是想改善一下生活的,这下又遥遥无期了。 脸书谷歌这样的公司虽然不吝啬科技投入,但你做的技术能不能变现,待遇和地位还是差很多的。 你像孟繁岐,原本就是谷歌大脑的一个普通打工仔,三轮板斧一挥,谷歌现金流都不方便给他那么多分成,已经谈过相当一部分以股权的形式给到了。 瞬间变成了持有份额不小的股东,地位自然水涨船高。 这事情也是够离谱的,人还没正式入职呢,一不小心就从打工仔变成小老板了。 虽然折算下来,孟繁岐一年后能够到手的谷歌股权只有不到百分之03,但谷歌是一个经过多轮融资的巨无霸。 即便是创始人佩奇和布林,所持有的股权也仅只有百分之55左右。 谷歌的股价还是一路起飞的,从14年的30左右,到22年最高峰接近150。 十数亿美金的资产如果需要保值的话,化为股权先持有也是一个不错的选择。 等到有投资机会的时候,再取出一部分,比如特斯拉,比特币,都会是几十倍的利润。 但这些机会未必能经受得住太多的资金,马斯克不会坐视自己疯狂抄底,btc自己抄底太多,资本也可能选择其他的货币收割百姓。 总之,宗旨是先在谷歌保值,然后分散投资。btc,特斯拉,投资初创,自行创业,多点开花。 这样才最保险。 与此同时,华国港城的港中文大学里,华国学者汤小鸥带着他的一群学生和研究员们,神色凝重,气氛低沉。 就在一周前,汤小鸥团队的人脸算法识别能力首次达到了人眼水准(9753),按照原本的计划,团队会花上两三个月的时间将这个结果继续往前推进一些。 随后便会开启人脸识别技术落地的时代。 可惜天不遂人愿,孟繁岐横插一手,给落地难度来了个超级加倍。 “我们目前有什么办法可以分辨生成式内容吗?”汤小鸥是残差网络原作者恺明的恩师,恺明09年一鸣惊人的暗通道去雾算法,便是在汤教授的指导下做出的。 一举夺得了视觉顶会cvpr的最佳论文,这是该顶级会议25年历史上第一篇斩获此荣誉的亚洲论文。 在深度学习未如此流行之前,汤教授的实验室就已经频繁在国际顶会上发布相关论文。 11-13年间的顶级视觉会议上,汤教授实验室在深度学习领域上产出的论文数量,与世界上其他所有机构的总和相当。 足以可见其远见、技术实力和理论底蕴。 可饶是如此汤教授面对这个突如其来的安全性难题,也仍旧是一筹莫展。 “汤老师,facegan虽然公布了论文和展示网站,但是其具体的训练代码和做法细节,我们完全不清楚。在这种情况下,我们很难总结出任何有价值的规律。” “是啊,汤老师,生成式技术是比较新的技术,用在人脸图像上也是第一次。我们在这方面没有经验,解决这个问题可能需要相当长的一段时间。” “倘若我们通过他们的[这些人并不存在]网站,收集大量的生成内容,有没有机会总结出什么规律?”汤小鸥眉头紧锁,对方的技术路数新颖,己方完全不熟悉。 想要从源头上搞明白,实在太久了。 他的想法是,通过这些虚假的内容,专门做出一个针对性的检测器。 和自己原本的核心识别部分分开,独立进行。 不得不说,这也是一种思路,可生成这些虚假数据的模型,也是从这种对抗中训练而来的,短期之内,很难取得什么成效。 “我们先发布技术,这个难题之后再解决。”几乎是同时,脸书和汤小鸥实验室均做出了这个决定。 在原本时间线,两边的技术发布都要再迟上一两个月。 但突如其来的难题,让两边都意识到夜长梦多,再不发布,搞不好局面会更加尴尬。 第128章 你这App比我们实验室专业多了 2014年1月,面对生成式技术facegan在人脸数据上的安全性问题,脸书的deepface和港中文的汤小鸥实验室顶住了压力,硬着头皮强行放出了各自的最新进展。 两边的想法其实差不多,发布技术可能会面临一些安全性问题和质疑,但不发布,肯定是什么都没剩下了。 毕竟两边在性能上,还是均做出了一些突破的,不会真的因为这种事情裹足不前。 相比于人眼识别能力在lfw数据集上9753的能力,两边发布的技术deepface和deepid均突破了这一界限。 原本时间线上仅有9735的脸书团队,借助孟繁岐的一些思想,将该精度提升到了9789。 而原本时间线上有高达9852能力的汤小鸥团队,由于提前两个多月发布,则遭遇了性能的降低问题,发布水平为9795。 不过仍旧以微弱优势战胜了脸书团队。 “脸书的算法比我们拥有更多的人类真实图像资源,我们作为实验室在这方面有巨大的劣势,双方的实力差距很大。不过我们仍旧顶住了压力,克服了困难。”汤小鸥面对采访的时候,如此回复到。 这是人工智能方法首次在人脸识别领域突破人类水准,在全球引发了巨大的轰动。 同时,也让原本就火热的虚假生成人脸问题热度再创新高,所有吃瓜群众看到这些新技术之后,第一个想问的问题就是,你这个最新的算法,它到底能不能分辨虚假的生成的人脸? “利用城市各个角落的摄像头抓拍的人脸图像进行对比,自动识别犯罪并发出劲爆。根据性别,年龄等属性表情快速查询人物信息,这些科幻电影中的情节,脸书正在逐渐让它们成为可能。” 脸书有一些新闻稿在宣传自己的技术,但似乎下面的围观群众们不是很吃这一套。 “别吹了别吹了,我们就想知道你们的新算法能识别生成的假脸吗?” “你们的新算法能处理人工智能的安全危机吗?” “”,面对不明内情的群众,脸书的技术团队也比较无奈。 很多技术都并不是完全安全的,只是眼下这个时间点,这个问题实在热度太高,也太过敏感。 脸书的宣发策略是,不正面回答。 但大家心里都很清楚,不回答其实很多时候就是一种回答。 此情此景,如果不能正面回答这个问题,那么这个问题的答案,其实已经非常清楚了。 那就是:“对不起,做不到。” 而港中文这边,由于在华国境内,受到的舆论波及就要小很多。 华国内部虽然有一些相关的报告,但是并没有形成那么夸张的舆论风暴。 并且由于汤小鸥团队在总体情况劣势的局面下,仍旧力克脸书团队,总体来说是一件非常值得宣传的事情。 扬我国威嘛。 因而由央视新闻亲自出马,对此事进行了相关的采访和宣传,总体基调非常正面。 “作为人脸识别准确率记录的创造者,港中文大学教授汤小鸥率领团队在日前击败了脸书团队和人类的辨别水平,让机器学会了[明察秋毫]。汤教授的实验室曾经入选全球人工智能十大先锋实验室,是亚洲区唯一入选的实验室。” “” “让我们有请汤教授谈一谈这项技术和人工智能对人类和对华国的意义。” “人工智能与产业结合将成为下一波产业升级的主要驱动力,加快源头创新是华国抓住新一轮发展机遇的关键。而技术研发没有捷径可走,这是一场长期投入的马拉松。只有在源头上掌握了技术,才能不被别的国家扼住咽喉。” 汤小鸥感叹道,“作为一名知识分子,我一路上享受了国家最优质的教育资源,我应当为国家的源头创新发展做一些有意义的事情,也在基础研究方面为华国人争一口气,这是当代知识分子应有的情怀。” 两边的团队,都很清楚目前自己技术的一大缺陷,但却都默契地没有提及。 而与此同时,孟繁岐视界公司旗下的ai相机,已经偷偷更新了一版生成式图像的鉴别功能。 就在年龄和情绪编辑功能的旁边,并没有专门的更新日志又或者是提醒,悄悄地就更新上线了。 脸书deepface的杨明,这两天终于有了一些空闲。 虽然全美知名媒体都参与了的人脸安全性问题没有得到解决,但这个版本总算还是发布出去了。 作为打工人的他,也迎来了久违的轻松假期。 “最近同学怎么老给我推荐这个ai相机的app?”孟繁岐ai相机app目前只在国内上了架,杨明并没有看到,不过他有不少同学回了国,都玩过这个产品。 “相机有什么好玩的,还说跟我现在的研究方向相关?就吹。”杨明心中完全是不相信这件事的,在他看来,这种app也就是加点滤镜,和自己做的高精尖人脸识别怎么可能会是一回事? 前几天看到这些消息的时候,他直接就忽略了。deepface发布在即,他可没有什么时间去看这种无聊的特效。 按理说,闲下来之后他本来也不会去看的,今天却不知怎么了,拿起手机下载安装了这个在国内已经有了不低热度的app。 “年龄编辑表情编辑??这特么是一个相机app该做的事情吗???”杨明看完之后人都晕了,这技术比他们脸书团队都专业多了。 “真假辨别?什么是真假辨别,是我想的那个真假辨别吗?”杨明眉头紧皱,心说不会 可如果不是指“判断图像是否是由人工智能方法生成”的话,正常图片还能有什么真假的说法? 这特么到底是什么鬼? “我测一下。”杨明如此想着,登陆[这些人都不存在]网站,存下来几张图片。 传输进去之后,均判断为[假脸]。 ??? 打开相机自拍了一张,判断为[真脸]。 什么情况?它不会是搞我呢? 杨明如此想到,正常人看到这个功能,都会搞一点假的生成图片来测试。 而假的图片是拍不出来的,一定是读取相册,而真的图片,则很可能直接拍摄。 其实它根本就没有这个辨别的功能,只是无脑地根据相册和相机输出真假。 一定是这样的! 杨明如此想着,又上传了一张自己以前的照片,仍旧判定为[真脸]。 这下他彻底绝望了,带着最后的倔强,他又上传了一张风景照。 结果判定为[没脸]。 你这app搞得比我们专门的人脸实验室团队都专业啊 杨明觉得这下自己是真没脸了。 第129章 逻辑完爆 由于孟繁岐的低调处理,加上app暂时只在国内上线了,美国相关人士中,像杨明这样发现了ai相机app已经有了辨别真假功能的人并不多。 意图占据道德高点n一方诸如卡弗蒂,完全没有意料到自己目前最主要的有利论据早已被孟繁岐妥善地解决了。 他们的注意力都被脸书和汤小鸥团队的新技术给吸引了。 “最新的人脸识别技术已经突破人类的能力,但是还是拿这种生成式的假图毫无办法!” 这真是太好了,佐证了我们的观点n那一派的人心中都如此想到。 全然没有发现这件事情本身到底有多么讽刺——那就是他们根本不在意技术有没有解决这个难题。 相比之下,他们更关注的事情是自己的报道有多少热度,而自己的观点绝对不能被证明是错误的。 至于真相和问题的解决办法,那才不是他们关心的事情。 论战的时间临近,这件事即便在国内也有了不小的热度。 国内的宣传口径基本完全淡化了生成式内容的危机,主要是强调我方的科技赶超,我国学者发明了生成式技术,我国汤小鸥团队则夺得了人脸识别方法的世界第一。 孟繁岐其实也在想,如果自己并非是华国人,是否会遭n这样的针对? 只可惜这个问题没法得到答案。 在这样的总体氛围下,围脖上有很多的网友留言又或者私信他表示支持。 虽然这些支持没有很强的实际意义,但在精神层面上对孟繁岐的帮助还是不小的。 几天的时间转瞬即逝,很快就来到了双方的约定时间。 从名义上,把这件事定义为n评论员卡弗蒂自己的私人行为。 “就是甩锅嘛,自己立于不败之地。”孟繁岐扫了一眼,大概就明n是什么意思了。 如果谈完了大获全胜,反响不错,就加大力度宣传一下,搞得像是自己获胜了。 反之,如果谈崩了,卡弗蒂表现得像个小丑,又或者是有不当言论激怒了大众,就马上把自己撇的干干净净,说这只是评论员个人行为,和本台无关。 真够怂的。 正式会谈开始,画面一分为二,左边卡弗蒂顶着秃顶的大光头亮相,皮肤松弛,尽显老态。 孟繁岐看了也是一阵无语,七十来岁的老头子,不好好在家养老算了,还跑出来针对华人。 08年奥运的时候也是这老逼登跳得起劲,被不少华人集体签名抵制过。 画面闪烁,屏幕右边显示出孟繁岐的半身,只不过,脸部却是经过facegan实时编辑过后的。 facegan目前针对某一张图片花大量时间调整,能够有比较逼真的效果,但若是实时应用在几十帧的摄像头上,就显得相当吃力了。 在脸部移动的时候,就会露出比较大的破绽,被发现面部是经过编辑的。 卡弗蒂一眼就看出了孟繁岐脸部的问题,他先发制人,咄咄逼人道:“孟先生,为什么要藏头露尾,不敢以自己的真面目示人?难道是做贼心虚了吗?” 他没有想到,这本来就是孟繁岐故意露出的破绽。 作为技术的发明人,难道他会不清楚,目前的技术情况无法支持高帧数的实时面部调整吗? “卡弗蒂先生一眼就看出了我这个技术发明者使用了facegan技术,好像目前阶段识别生成式的内容并没有你们说的那么困难嘛。是你在危言耸听,还是说你认为世界上其他所有人都远比你要笨呢?” 现在facegan的质量原本就没有到会给社会带来巨大危机的地步,即便是后面非常成熟的换脸技术,短短的一两分钟内也是会有多处破绽的。 卡弗蒂由于自己刚刚气势汹汹地,一下子就指出了对方使用生成式技术,现在想反悔也晚了。 在这件事上掉入陷阱,无话可说的他随便应付了两句之后,便急忙转移话题,试图在国家大义上占据道德的制高点:“孟先生此前说美国人都是移民的言论,是非常不负责任,且荒谬的。” “难道不是移民吗?” “是我们发现了美洲大陆。” “为何早已有人居住的大陆可以被你们[发现]?”孟繁岐被这个逻辑都笑了:“如果我此刻坐在你的对面,我想我走出演播室的时候可以[发现]你的车,不知道我可不可以把它开走?” ...... 继续交锋了几句之后,卡弗蒂发觉情况不对,这个华国人对话的风格并不像大多数典型的华国人那样内敛,而是有一套自己听着觉得是歪理,却根本很难反驳的逻辑。 “孟先生对美国的历史和文化缺乏充分的了解,我们在这些事情上是辩论不出什么结果的。”卡弗蒂倒打一耙,先把一切的锅都归咎于孟繁岐不懂,试图将话题拉回到主旨,生成式技术的危机上。 不过此时,围观的群众们眼睛却是雪亮的,他们大都早已看出,孟繁岐占据了巨大优势。 “我们学霸这几句话,直接把这老逼登脑子绕晕了呀。” “有的白皮就是不要脸,抢了人家的就真当是自己的了。” “生成式技术是相当危险的新方法,提出仅仅几个月,就已经在特定领域上取得了巨大的突破。”卡弗蒂如此说着,自己的半身像消失不见,转而展示了几张格外精美逼真的肖像图。 这些人像均是由孟繁岐的facegan技术生成的。 “还专门挑了几张效果最好的,真不知道我是该感谢他们还是怎样。”孟繁岐无奈地笑了笑,现实就是这么有趣,敌视自己的人反而在找自己技术效果最好的例子,这场景真是有够荒诞的。 “最新的两种人脸识别技术,均无法正确区分这些逼真的生成式内容。”卡弗蒂一边夸赞孟繁岐的技术,一边得意洋洋的样子,让孟繁岐心中五味杂陈,不知该用什么表情面对:“即便是脸书最新的deepface技术,又或者是港中文的deepid技术,都是如此!” “我们有理由怀疑,该技术会对我们的生活和权益造成严重的不良影响!” “问题是,谁告诉你最新的人脸识别技术无法识别这些生成式内容的?”孟繁岐心中一喜,可算到了我的广告时间了。 第130章 广告时间到! 卡弗蒂扯开话题后渐入佳境,他以为最近脸书和港中文的最新研究给他打了助攻,佐证了他的观点。 最新的,突破人类水平的人脸识别算法也拿生成式的假脸没办法,这不是正好契合他的人工智能危险论吗? 虽然吹嘘这个华国人的技术让他非常不爽,但是一想到自己的观点可以极大地影响他后续技术的使用场景和应用范围。 可以让这个华国青年天才前途受阻,卡弗蒂心中还是一阵舒爽,这辈子就好这一口。 可说着说着,却没想到孟繁岐直接来了一句,“谁告诉你最新的人脸识别技术无法识别这些生成式内容的?” “???” 卡弗蒂光秃秃的脑门上全是问号。 最新的研究,脸书和港中文的新方法不是前两天才发出来吗?不是两边都没法处理这个棘手的问题吗? 虽然两边不约而同一起首次突破了人类的能力界限,但拿生成式的虚假内容还是毫无办法的。 难道我有哪里搞错了?我昨天光是看文献就看了好几个小时呢。 卡弗蒂毕竟不是业内人士,一想到对面这个人的技术实力,他本能地就有点慌了。 手忙脚乱地低下头,看了看自己昨天临时抱佛脚整理的笔记,翻来翻去,似乎没什么问题啊。 他的心又放宽了下来,这小子是在虚张声势呢。 正当他心中内心戏十足的时候,孟繁岐突然低了一下头,不知道从哪儿直接掏出一个手机,在所有的直播观众面前开始打广告了。 “ai相机——一款深受欢迎的人脸编辑app。我们的应用主打人脸相关的图像功能,包括可编辑年龄,可编辑表情。 还有最重要的一点,它可以检测人脸图像是否是生成式内容。” “呃...你”卡弗蒂刚刚开口,就被孟繁岐后面的广告词打断了施法。 “ai相机的年龄编辑功能可以让你穿梭时空,遇见过去和未来。 表情编辑功能更是令人惊叹。无论你想要添加微笑或完全改变表情,ai相机都可以实现,您只需通过几次点击即可实现。 此外,ai相机还可以检测生成式技术,确保您图像的真实性,让您可以信任所看到的图像。 还在等什么,赶快拿起电话订...啊不对,赶快登陆平台下载吧!” “.......” 沉默是今晚的康桥。 不仅是卡弗蒂沉默了,正在吃瓜的群众们也沉默了。 “都说现在广告无孔不入,连这种辩论直播也能插播广告吗?” “这是提前拍好的还是....” “是否稍微突兀了那么一点。” 由于孟繁岐的广告插入,不少不大清楚情况的人已经有点分不清现在到底是在进行节目,还是在播放广告了。 现在还被你拿去给自己的产品打广告了? 那我不是成了送人头的了吗??? 卡弗蒂半晌才消化了刚才的这么一出,他有些难以置信地问道:“你...额..你说的是真的吗?” 这实在也由不得他不慌,如果facegan的识别危机被妥善解决,n一方确实显得有些撒泼打滚了。 未来的危机毕竟是未来,如果完全脱离现实去吹以后的危害,没有那么多人会买账的。 “哈哈哈哈,我们学霸给这老逼登整晕了。” “太抽象了,我一时间都有点跟不上,别说人七十多岁的老头了。” “老逼登选错对手了,人家本来就是生成技术之父,对自己儿子还不是门儿清,一出手就把虚假识别问题给你解决了。” “哈哈哈哈,搭了半天台子,最后让人家把戏给唱了。” “听说目前的人脸识别算法由于facegan技术,受到了一些影响。我为此感到深深的歉意,作为补偿,我们视界公司还推出了一款自己的人脸识别技术,不仅可以轻松地识别生成式内容。 其本职工作,人脸识别准确度也在最流行的lfw数据集上,更是达到了99.6%,这已经远远超过了人类的能力水平,也超过了最近其他机构发布的新技术很多,具备极强的工业商业落地价值。” 孟繁岐一边说着,一边展示了这两个功能,面对突如其来的广告,观众们虽然非常惊讶,但还是很快理解了这两个功能的效果。 美国佬吹得那么严肃的大问题,好像被解决了嘛.... ??? 你小子没完了是吧? 卡弗蒂脑门上的问号一波未平一波又起,他还没消化完前面的信息呢。 这个什么app,怎么就具有脸书这样的巨头公司都没法处理的生成式内容识别能力了? 结果孟繁岐下一波的广告就已经来袭。 直接给自己公司的识别算法也打了个广告。 “哈哈哈哈哈哈哈,我以为广告已经结束,结果只是一个开始。” n选择直播而不是录播真的血亏,这才不到十分钟的时间,打两个广告了,想剪都剪不了。” “识相点就把直播掐了算了,再播下去输得底裤都没了!” “哈哈哈,这小子一会直接直播征婚我都不奇怪,还真挺有意思的,学霸竟然也有这种风格的。” 不仅普通网友看了之后觉得啼笑皆非,就连抽出五分钟看了个热闹的王义部长,也觉得这事真是荒谬至极。 本以为再怎么也是一场激烈的论战,却没想到变成了广告现场,就差现场签单了。 这下好了,别说公安部那边负责这方面的梁发明了,就连自己这样的大忙人也知道了他的公司,他的产品还有他的人脸识别技术。 “这波广告费少说省了八位数,真的赚到!”孟繁岐也没有想到,事情竟然会这么顺利,脸书和港中文破釜沉舟,提前发布了技术。 原本更有潜力的港中文一方,性能有所下降,这就让他的优势显得更加之大了。 “借着这个热度,我的ai相机app不仅能迎来新一波用户潮,还能直接登陆欧美。顺便连后续的主要业务也给他宣传了一下,舒服了。” 原本这个app还是不够大众化,用户上千万之后增势就减缓了很多,这回直播相当于首页封面推荐了,爽爆。 至于后续的业务,想必看完这个直播,很快就会有人来联系自己。 n这一边,则是完全没有想到会是这个局面,几个负责人恼羞成怒。 “卡弗蒂这个老废物!完全被对方牵着鼻子走!他真是老糊涂了。” “他忘了这种时候的准则吗?要扭曲,打断,不承认。” “曲解他的意思,否认他的成绩,扭曲他的动机,打断他的长篇大论。” “再不济,直接人身攻击他也好啊!” “太迟了..赶快掐了吧。” 第131章 历史的车轮 全美瞩目,在全球都有着一定关注度n评论员与生成式技术发明人孟繁岐的论战,有些荒唐地落了幕。 决定性的技术革新彻底摧毁n的出发点。 最大的论点论据,被对方的新技术轻易击破,现阶段的生成危机对方完全有办法应对处理。 自己的主场直播不知怎么的,反而成了对方的广告舞台。 还打了不止一个广告,这实在太离谱了。 最n只得生硬地掐断了直播,推说什么设备故障,到此为止。 可以说是丑态毕露了。 “这一波操作是一举几得?”孟繁岐看着自己这两天安排得满满当当的日程表,心里乐开了花。 他也没想过事情会这样顺利,这一波力n得了名,广告打出去则是得了实。 ai相机app热度原地拔杆而起,并且顺利登陆大洋彼岸。 除此之外,孟繁岐更关注的人脸识别算法的落地问题,也有了飞速的进展。 其中最大头的两个项目——政府和移动支付,经此事件之后,可以说是一片坦途,顺利得不能再顺利了。 至此,孟繁岐在这一阶段个人能为视界视觉做的事情,基本上已经做完了。 最核心的业务就是领先的人脸识别能力,光是把这个技术产品化,利用好孟繁岐这段时间抢下的优势,就够这些人忙的了。 听闻老板要将自己的主要精力转移走,视界视觉这边的员工先是难以置信,感觉天要塌了。 气得孟繁岐笑骂了一句,“事情都让我干了,还招你们来做什么?” 说来也是。 核心技术老板自己做了个世界领跑的,最大头的客户老板直接拉来了政府和阿狸这种级别的客户,就连广告老板都亲自给打到全球范围去了。 这一手满满的好牌,别说专业的管理人,就是孟繁岐他奶奶来都会打。 这个局面要是再能玩脱了,真不如乘早自杀算了。 2014年一月中旬过半,起飞去宝岛之前,孟繁岐满满当当地安排了两整天的日程。 用来专门招待以马芸和梁发明为首的客户们,这算是他最后的努力。 再往后的那些琐事与技术的相关性就不强了,一不是孟繁岐所擅长的,二也不是孟繁岐所想做的,他就不准备过多插手了。 重生以来也有快一年的时间了,主要路线其实相当明确,就是顺着自己最熟悉的视觉算法路线先变现。 如此积极地搞钱,主要还是为了有资本去自己搞中文数据基建,做大平台出算法,和其他巨头一样成为棋手而不是棋子,弥补中文语言大模型的劣势,而不是为了圈钱而圈钱。 如果只是为了钱,财富自由为标准的话,他孟繁岐早就能退休了。 单就从谷歌那里薅过来的巨额本金,随便分散到几个着名的暴涨领域当中,早就是几辈子也花不完的钱了。 有了这样难得的机会,亲身参与其中,与人类最聪慧的那些大脑们一同共事,甚至领导那些大规模的人工智能历史变革才是他更感兴趣的事情。 毕竟他也很好奇,这些惊人的成果背后到底有什么故事和内幕。 至于赚钱,只是技术的副产品罢了。 等明天马芸来了,孟繁岐必定要在他面前抢先说出那句名言:“我对钱不感兴趣!” 在孟繁岐约见这些客户们的同时,就在14年1月这个时间节点,历史的车轮滚滚向前,谷歌在人工智能方面又有了一个大动作。 那就是以四亿美元的价格,直接并购了一家人工智能领域的小型公司,deepd。 这家2010年创办的人工智能公司,单听其名字,许多人可能会非常耳熟,却一时间想不出具体的原因。 不过,如果说起人工智能历史上非常标志性的事件,阿尔法狗围棋ai,想必就无人不知无人不晓了。 2016年四比一力克韩国传奇围棋棋手李世石,唯有第四局“神之一手”于不可能处求得一线生机。 数月之后,威力再度升级,百年难得一遇的华国围棋天才柯洁,虽然招招完美坚持到中盘,却终究无法一直维持巅峰算力,竟一盘都未能从加强版阿尔法围棋ai手中赢下。 可以说阿尔法围棋ai彻底改变了整个围棋界,让这个有着千年历程的古老棋类游戏来到了一个全新的境界。 柯洁后来回忆当中更是其直呼围棋上帝,称它能够打败一切。 这家公司和后来闻名世界的openai很像,都是小团队作战。 公司人数不多,专营两三个方向,潜心打磨。 不鸣则已,一鸣惊人。 deepd的围棋阿尔法狗系列,和阿尔法fold蛋白质系列,都是出圈的革命性成果。 openai就更不用说了,chatgpt应该可以说是历史上最破圈,最下沉到个人用户的人工智能产品。 不过,在openai还没有创建组办的当下,在openai的首席技术官伊利亚仍在谷歌大脑的现今。 谷歌收购deepd,在一定程度上可以说是历史性级别的强强联合。 deepd这家公司有点特别,主要的几位领导人物,包括首席执行官戴密斯,都是棋类游戏的忠实拥趸。 戴密斯曾经是国际象棋天才,而代替阿尔法围棋ai与李世石对弈的黄士杰博士,则是一位水平不俗的围棋业余六段棋手。 他们的内核是希望开发一种人工智能软件,使之可以在面对任何问题时完成自学。 戴密斯认为,这有助于解决一些全世界最棘手的问题。 “人工智能很有可能令人类震惊,”他说,“它可以加速疾病治疗速度,还能加速各种目前进展较慢的事情。” 或许在围棋ai时代,人们虽然震惊于人工智能的智慧和威力,但却很难想到更加实际的意义,围棋毕竟只是一款棋类游戏。 即便是图版类游戏难度的巅峰,也不能改变什么。 不过很快,阿尔法fold在蛋白质上的突破,让世界彻底重新认识了这种能力。 谷歌这次对deepd的收购,是由创始人佩奇一力促成的。 “这实在是我很久以来见过的最惊人的技术之一。”佩奇对deepd的前景信心十足,“如果有什么需要的资源,可以跟我或者是相关部门的负责人去提。” “我们最需要的是庞大的计算资源。”戴密斯本能地回答道,在他看来,团队的人员配置其实已经基本完备了,主要短板还是小作坊硬件设备跟不上。 “还有就是,我们希望能和谷歌大脑团队的孟繁岐谈一谈。”戴密斯又思索了一番,追加了这么一个需求。 第132章 黄博士来电 孟繁岐重生前,在openai的chatgpt还有微软的bg压力之下,[谷歌大脑]团队和[deepd]团队两大人工智能组织进行了合并。 合并之后的[谷歌deepd]首席执行官由戴密斯担任,杰夫反而转任虚职,担任团队首席科学家。 戴密斯作为被收购的一家小公司创始人,能够在人工智能这个谷歌非常关注的领域内,合并后职位隐隐压过谷歌元老杰夫,可见戴密斯其人颇有一些手段和才能。 不过那是十年之后的事情了,如今的戴密斯刚刚有了新东家,还想要张口分谷歌大脑团队的资源,面对杰夫的时候还是颇为忐忑不安的。 好在杰夫终究还是偏技术型的管理者,对于deepd团队的成就也颇为赞赏。 两边的交流还算是顺利和愉快。 只是谈到谷歌大脑团队成员——孟繁岐的时候,杰夫表示自己并做不了决定。 “他如今可是享有特权的大红人,如果你们需要他的帮助和参与,还是自己直接去联系他。” 这个回答,让戴密斯有点惊讶。 孟繁岐如今甚至都没有正式加入谷歌,就已经有了如此高的地位,这实在是让人难以想象。 deepd在被收购之后,除了刚需的计算资源之外,打得第一个注意就是谷歌大脑的孟繁岐。 这是黄士杰博士一力主张的想法。 在他的视角看来,孟繁岐很可能是deepd现下最需要的资源,一个出色而富有创造力的大脑。 并且同为华人,孟繁岐天然就比欧美的学者更加能够理解围棋的文化底蕴。 而接到黄博士电话的孟繁岐则是一脸懵,不过好在黄博士由于前世充当阿尔法狗的代言人,代替阿尔法狗与李世石和柯洁两人对弈落子。 孟繁岐一接通视频,虽然看上去有些不同,但还是立刻就认出了他。 一番介绍和寒暄之后,孟繁岐直奔主题。 “黄博士突然联系我,有什么要紧的事情?” “要紧倒也谈不上,主要是我们有一个智能棋类的大型项目,不知道你有没有兴趣参与。目标是人类史上最难的图版棋类游戏,围棋,我们希望可以使得人工智能程序在围棋这个世上最难的棋类游戏上,真真正正地战胜职业围棋选手。” 黄士杰当然不是要孟繁岐全职加入进来打白工,他知道孟繁岐正处在技术的巅峰期,发布新方法跟下蛋一样快。 没那个理由和资格去要求这样的新星加入队伍给自己打工。 他所求的,只是孟繁岐间歇性地参与讨论,提供给他们一些意见和看法。 此前孟繁岐的不少思想,对阿尔法狗的基本框架建设就已经起到了重要作用。 “前段时间使用了你的残差思想,对我们的性能帮助很大。你的生成对抗思路,也对我们有所启发。”黄博士倒也没有恭维的成分在,残差思想基本上对所有需要一定规模深度网络的算法都有不小的帮助。 除此之外,孟繁岐在优化器,归一化等其他方面的工作也很让黄博士耳目一新。 可以说每次看孟繁岐的文章都有些新想法和启发,加上两人都是华国人,黄博士便很希望孟繁岐可以参与这个项目。 对于围棋这件事,终究还是华国人更能理解他内心中的那种情怀。 不过唯一担心的事情是,围棋ai并不是一个很有商用价值又或者是工业落地前景的方向。 说白了,这个东西,它赚不到什么钱。 项目做起来像个貔貅,只看到钱进去,看不见东西出来。 而孟繁岐作为人工智能学界飞速升起的新星,尤其在检测相关算法上突破众多。 检测相关的许多技术落地的条件已经成熟,做这方面的研究肯定是收获颇丰的。 对比之下,他不见得能够看得上这个围棋ai的项目项目,即便看上,也不见得有这个时间来参与。 不过黄博士还是进行了努力和尝试去邀请。 “正好deepd刚刚被谷歌收购了,我就去问了下杰夫有关你的情况,想看看有没有合作的机会。杰夫和辛顿说,你现在虽然是谷歌大脑的研究员,但是享有很高的自主权,他们不会对你多做什么限制,也不是特别清楚你的时间安排,因此让我直接来跟你联络就好。” 黄博士说这话的时候,其实也有些好奇。 研究员这样的岗位,的确有一定的自主权,可以根据自己的特长和喜好做一些研究方向的选择和取舍。 可像孟繁岐这样,两个大领导明显都表露出“由他去”“我可管不了这家伙”态度的研究员,实在是不多见。 “我主要是给谷歌稍微创收了亿点,也就亿点点。”孟繁岐哈哈大笑,这事情上回辛顿跟他聊过。 自从孟繁岐三板斧给谷歌广告收入创收三分之一之后,谷歌大脑整个部门的特权就算是彻底确立了。 钱钱钱,所有董事的命脉。 谁能如此强力创收,谁就能享有无限的特权。 孟繁岐一创收,整个部门都跟着喝汤。 谷歌因此彻底确立了人工智能优先的企业宗旨,谷歌大脑的地位自然就无比超然。 而这一切的最大功臣孟繁岐,当然也就无人能管了。 人家就是没服从指令,这才搞出了这么多的营收。 怎么着,你想管他?你给谷歌创收了多少? “不瞒你说,我其实对围棋ai还挺感兴趣的,方便的话,今天先说一下目前的进展?” 孟繁岐不像黄博士,棋力很高,差不多都有业余六段的水平了。 他的水准基本上是刚读懂围棋的基本规则,一次都没跟人好好下过的水平。 也就看了战鹰和雪糕几个基础教学视频,还是没太专心看的那种。 但这丝毫不影响他对围棋ai的兴趣,他关注其中的ai远大过围棋。 孟繁岐这一年来都专注于积累原始资本,拿自己最熟悉的视觉技术去变现,险些都要忘记一些基本的人生追求了。 视觉算法,尤其是检测方面的这一系列操作,yolo-多目标-人脸,都是孟繁岐前世的舒适区。 各种技巧和源码滚瓜烂熟,完全可以一人成军,整套功能开发下来,都不带卡顿的。 这些都是前世变现最成熟的技术,流程和原理也没有那么麻烦。 而阿尔法狗这样的复杂系统,就不是孟繁岐一个人拍拍脑袋可以复现出来的了。 其中海量的棋谱数据,输入的方式,评分的标准,搜索对抗的原理和筛选策略。 这部分内容孟繁岐基本上都不大熟悉,谁让不能变现的技术,面试考得太少呢。 第133章 棋类智能的过去 围棋的基本规则听起来并不困难,顾名思义,就是要以己方的棋子围杀敌方的棋子,最后双方比较自己围起来棋盘面积,来确定胜者。 古时称“奕”,“奕”中要“悟”! 这种游戏形式相传在春秋战国时期就已经存在,算得上是中华民族历史最悠久的智力活动之一。 在三国时期左右彻底流行了起来,当时的诸多文人名士,均好对弈,并以好棋艺为傲。 晋朝流行各种文人风骨,下围棋吹牛皮更是成为风尚。 大约是在隋唐时期,围棋传播到了如今同样比较活跃的日韩地区,而后至世界各地。 围棋的棋子仅仅只有一种,这与不少其他流行的棋类,诸如象棋,军棋,国际象棋等完全不同。 没有名称各异,功能和用法各不相同的棋子,双方仅各持黑白圆形棋子进行对抗。 赛事所用的棋盘,横纵各一十九条线,共计三百六十一个交叉点。 棋子一一落在这些交叉点上,交替行棋,落子无悔。 可恰恰是简洁的棋子和行棋规则,衍生出了无穷无尽的变化,其中的繁杂程度远胜规则花里胡哨的不少其他棋类。 三百六十一个落点,每个落点又均存在三百六十手应对。 如此循环往复,可以计算得出,在标准的19x19棋盘上,一共会有361!种各不相同落子顺序。 有人可能会说了,361看起来好像也不大啊,但实际上阶乘符号!代表的是所有小于和等于该数的正整数的积,是一种两百年前引入的数学概念。 即n!=1x2x3xx(n-1)xn。 也可递归写作,0!=1,n!=(n-1)!xn。 越往后面,数字的规模成长得就越快。 举一个比较好理解的例子,仅仅只是21的阶乘,数字就已经来到了5x1019,5000亿亿。 亿兆京垓秭穰沟涧正载极。 10的二十次方读作垓,21!可以读作05垓。 而128!的阶乘,数量已经达到10的215次方,是上面那个5000亿亿的不知道多少倍了。 也算不清楚到底该怎么去读它。 如果想要穷举围棋的所有的基本可能,将会有超过10的760次方种可能性。 这还没有把提子算入其中,许多被提走的区域仍旧可以继续落子,围棋也常有下到400手开外的局。 世间流传,围棋的可能性总数比宇宙原子的数目还多太多(1078-1082)之间,并不是吹牛。 真要论数量级,那实在是差了太远了。 当然了,这其中有许多种变种可能永远也不会发生,比如开局谁都不会下在最边界上。 但即便除去这些,余下的变数也仍旧是永远也无法穷举的。 孟繁岐对早期的一个小故事有点印象。 最早的棋类[ai],可以追溯到1769年。一个德国发明家肯佩伦,发明了一个会下国际象棋的机器,叫做土耳其人。 这个装置上面放着一个国际象棋棋盘,棋盘的对面坐着一个土耳其装束的木头人。 1809年的时候,这个装置被拿给了不可一世的法国皇帝拿破仑观赏。 拿破仑先手,结果被土耳其人下爆了,最后恼羞成怒,化身桌面清理大师,把棋子全都扫到了地上。 声名大噪的土耳其人,此后还曾和多位知名人士对弈,甚至还在欧洲进行了几十年的巡演。 结果最后被人发现原来不是人工智能,而是一个街头魔术。 这个机器里总是特么的藏着一个国际象棋高手! 后来由于人有三急,机器里藏得人终究得出来不可,因而终于被人发现了其中的秘密。 其实想想也是,那时候的计算技术才什么水平,怎么可能攻克如此的难题。 不过从当时的反响和热度可以看出,棋类运动一直都是人类智能的一大挑战,是一种智力和博弈能力的证明。 棋类智能也理所应当,成为了某种象征,总是吸引着人类去征服。 着名计算机大牛图灵其实也是这方面的爱好者,当时二战都还没结束,图灵就已经私下偷偷在研究计算机下棋了。 1947年的时候就编了一个下棋程序。 只不过那时候计算机的使用是一种非常珍贵的资源,即便是图灵也没法保证充分的使用时间。 相比图灵这位大佬的其他事务,下棋好像显得儿戏了一些,这件事便一拖再拖。 “其实最恐怖的事情是棋类的必胜法则。”孟繁岐回想了一下,好像井字棋,五子棋之类的简单棋,都有诸如“先手必胜”的法则和规律。 一旦棋手掌握了这种定式,这种棋也就在相当程度上失去了存在的意义,变得索然无味。 黄博士在电话中,还为孟繁岐介绍了一下隔壁跳棋的研究情况,这是孟繁岐未曾关注过的。 “2007年9月,跳棋已经被证明,只要对弈的双方不犯错,最终的结果就一定是和棋。” 而跳棋智能已经达到了这个境界,这也就意味着,永远也不会有办法战胜这款跳棋智能。 这项研究发布在science科学期刊上,从此,跳棋这个领域多了一个可以看见的终点。 相比关注度比较低的跳棋,上一个比较着名的里程碑应该是国际象棋领域的“深蓝”。 1997年5月11日,ib的“深蓝”是史上第一位战胜了当时世界冠军的棋类机器。 事后,国际象棋冠军卡斯帕罗夫回忆道:机器表现超出他的想象,它经常放弃短期利益,表现出非常拟人的危险。 在“深蓝”赢了卡斯帕罗夫之后,职业棋手并没有因此而改行,他们反而更多地依赖计算机来训练。 职业比赛的解说者也越来越多地借助计算机程序来分析解说一场比赛。机器作为教练,反而更快地帮助人类棋手进步。 有美国高中的象棋教练观察到从来就没有过这么多年轻棋手在年龄很小时就积分这么高,这都得益于计算机教练,因为过去的孩子从来就没有机会能和特级高手比赛。 这件事最好笑的部分就是,做出了这个深蓝智能的成员均不是人工智能出身,他们也不相信这个程序真的有什么智能。 做出了重大成果的人屁股不在自己这一边,这让不少人工智能学者颇为恼火。 第134章 给你们来一个七定王 相对于计算机在国际象棋中的胜利,中国象棋的智能程序进展一直落后。 这倒不是中国象棋要比国际象棋难之类的原因,而是因为棋类智能对于大公司来说毕竟只是一种公关手段,没有实际上的营收价值。 “深蓝”取得国际象棋的胜利之后,许多人都认为计算机下棋这事已经差不多到头了, 继续去搞难度差不多的中国象棋费力不讨好,ib也解散了“深蓝”团队。 唯有围棋确实难度上要高很多,并且很具有挑战性。 一般人们都认为,计算机要在围棋中取胜比在国际象棋等游戏中取胜要困难得多,因为围棋的棋盘太大,下棋点极多,分支因子远多于其他游戏。 并且每次落子对情势的好坏飘忽不定,天堂地狱就在一瞬之间,技术很成熟之后,人们经常可以观察到那种一手棋下掉ai系统百分之六七十胜率的情况。 可以说是“一着不慎满盘皆输”的最好演绎了。 诸如暴力搜索法、alpha-beta剪枝、启发式搜索的传统人工智能方法在围棋中很难奏效。 不过围棋在西方没什么受众,主要热度还是在东亚三国,因此很长一段时间内没有太多人愿意花时间在这件事情上,这十几年的发展速度中规中矩。 deepd投入在这件事情上,很大程度也是机缘巧合。 一方面许多高层都热爱棋类,另一方面可能更加关键,deepd的核心成员,两位首席科学家之一的黄士杰在围棋智能上有着很深的积淀和情怀。 黄士杰的硕士论文是《计算机围棋的打劫策略》,博士论文是《应用于电脑围棋之蒙地卡罗树搜寻法的新启发式演算法》。 相比孟繁岐这种毕业了连本科专业知识都全忘了的人,黄博士可以说专业是非常对口了。 “其实现在的围棋智能已经有了一定的竞争力。”黄博士为孟繁岐介绍了一下现阶段围棋智能的棋力:“差不多最高才在业余五段左右的水平,如果不让子的话,和真正的职业选手对弈,毫无胜算。” 基本的围棋棋力划分孟繁岐还是大概清楚的,业余六段大约可以与职业初段水平相比拟。 黄士杰博士本人就是宝岛业余六段,算得上是职业水准守门员了。 倘若自己造出的智能程式能够稳定占据上风,自己完全下不过的话,基本上象征着围棋智能来到了真的职业水准。 而不是只能通过受让3-4子这样的方式击败职业棋手。 并且,如果造出来的智能下不过自己,这件事情属实没什么意思。 “你们目前的想法和策略大概是什么样的。”大概聊了一些情况之后,孟繁岐将话题切入了具体的算法部分。 从理论上来说,围棋问题的输入和孟繁岐非常擅长的图像类其实很像。 彩色图片在计算机中的形式就是多通道矩阵,通常为3通道,代表三原色。 比如,一张分辨率为224x224的图片,就是以三个[224, 224]矩阵的形式进行存储。 一般来说,每个位置的取值在0~255之间。 对于围棋这个情况来说,它的输入就像是一个19x19的单通道图片。 19x19表示棋盘上所有的落子地点,而每个地点的取值就只有三种状态,黑,白,无子。 可以用[-1,0,1]三个数字来指代。 而围棋智能的目标,所谓的下棋。 如果不考虑其中原理的话,它的外在反馈其实就是给定这样一个[19,19]的棋盘,希望程序可以在上面仅改变一个无子的数字0到给定的棋子类型(数字-1或者1),同时使得该方获胜的概率尽可能地变大。 “棋盘就是一副黑白的单通道分辨率为19的图像。”这个事情在普通人看来比较不会想到。 不过对于比较熟悉图像技术和深度神经网络的孟繁岐来说,是很自然的事情和概念。 “我们从深度神经网络的突破中获得了灵感,在2012年底的alex之前,疯狂石头这款围棋智能提供的准确率是最高的,达到35左右。 目前主要是在研究,如何使用深度神经网络使得围棋智能的判断更加精准。 alex和你引领的深度神经网络在分类问题上有了惊人的突破,这是我们今年启动这个项目的一大原因。 我们在尝试收集大量的专业对弈棋谱,目前已经有了十多万场比赛的内容。而从这十万多场比赛当中,又可以抽离出上百万个单次落子。 通过这个数据,我们现阶段在确立合适的网络结构,在这个方面,我想你是专家中的专家。” “我大概了解了。”孟繁岐听完之后基本明白了deepd现阶段的想法和进展情况。 虽然此前黄博士在围棋ai项目上有过很多研究,但阿尔法围棋项目毕竟才刚刚开始,同时也是基于全新的深度网络技术。 目前为止,他们还没有形成一整套的学习以及对抗的思路,那一套策略网络-评估网络-强化学习-蒙特卡洛搜索的总体结构还没有成型。 还停留在比较早期的阶段,甚至还没有最后决定到底使用怎样的网络结构比较好,此时正在对模型本身的结构进行测试和设计。 “这方面确实是我比较擅长的方向,尤其最近,我在cpu和小模型的设计上有一些想法,这些内容应该会对你们有一定的帮助。” 要说各种设备和各种类型的任务,网络用什么算子比较好,速度和性能怎么取舍,即便再往后五年,孟繁岐都是当之无愧的第一人。 因为他熟知的那些取舍和结论,都是后来谷歌这样的大平台nas(网络结构搜索)的实验结果。 所谓nas,其实就是一种穷举对比的方式。 在特定的数据集上,把所有想得到想不到的算子组合用穷举的形式全都特么的测试一遍。 最后得出的网络结构,当然会比人类自己设计的要好要快,不过换一个差距很大的数据未必好用。 获取这个答案的代价是相当惊人的,随着搜索空间的增大,显然需要非常恐怖的计算资源去支撑。 好在孟繁岐已经将几个大公司上万张显卡,数年时间测试出来的主要结论全都白嫖了。 这个知识的价格成本,恐怕不止十数亿美金。 “那实在太好了。”见孟繁岐一口答应在阿尔法狗的网络设计上提供帮助,黄博士喜笑颜开,“我们现阶段除了需要快速迭代对比确定网络结构之外,没有什么特别大的困难。” “如果非要说的话,就是缺少一个职业守门员级别的人类棋手。”黄博士想了想,补充道。 他自己业余六段,其实可以担当此任。 可他毕竟太过了解围棋ai,起到的测试效果可能不够真实,并且他也很忙,不可能一直负责对弈测试。 同时,欧美那边围棋的热度也并不高,樊麾二段就曾经多次夺得欧美围棋冠军,职业守门员级别测试员不是那么好找。 “这个没关系,我二月份会去一次英国,跟你们确认一下效果和后续的思路。”孟繁岐闻言笑了笑:“到时候给你们找一个守门员中的守门员。” 要说职业守门员水平的棋手,想必没有谁比已经连续定段了七年,今年正在第八次对职业棋手这个身份发起冲击的七定王战鹰,更加适合的了? 这门都守了第八回了。