百度ai开发者大会讲了点什么

时间:2022-06-01 18:13:25

       很高兴csdn给我机会,让我参加了7.5百度ai开发者大会,大会结束后,网上铺天盖地的报道也是层次不穷,我看了一下国内和国外媒体的介绍,大家对这次百度无人驾驶技术津津乐道。
下面就我的个人感受写一下,本人的关于这次大会的感受和看法。
上午参加的是百度大会的主论坛,大概四千多个人吧,我看到门口站着不少人,李彦宏到了也说,第一次面对这么多的人,发表演讲。可见大家对这次百度ai开发者大会还是给予期待的。废话少说,赶紧进入正题。
   首先陆奇做了开场主题演讲,大致就是阐述了人工智能的发展和对社会的意义,并举例说明了它的应用场景。主要向我们听众传达ai的重要性,给我们先入为主的观念,随后,陆奇很自然的就把话题转到了百度对ai的战略部署,以及自身优势的描述。同时他也说到这是一个大数据+算法+软件+硬件的时代。百度本身是有着17年的搜索经验,有着大量的数据,还有这超过两千多的ai人才。随后阐述了,百度在ai业务,金融业务,智能云,DuerOs,Apollo部署。他说的这些,我在随后的展会上确实看到了。
   陆奇做完演讲后,邀请了景鲲阐述百度DuerOs开放平台的具体细节,我这里做一个简短摘要,景鲲说道DuerOS就是唤醒玩物,对于我个人来说,我认为这是属于智能家居,物联网的一部分。他说人机交互的形式在不断地改进,从之前的鼠标键盘到手指触屏,再到现在的语音交互。我想百度的在智能家居方面的布局就是通过他们自己的DuerOs系统,连接各大传统电子产品厂商,赋予家电,电子产品新的交互形式。同时也宣布这些技术全部开源,当然厂商也可以申请免费开发者套件,降低了软件厂商和硬件厂商的技术对接门槛。总结一下就是将语音交互赋予传统电子产品,数码设备。展会上我也看到海尔和百度推出的智能冰箱,有一个很大的显示屏,不仅可以显示冰箱的温度,更可以在上面写上备忘录。还看到一款音响,你对着音响说小度小度即可激活,类似siri,你可以提出任何你想问的问题,包括播放歌曲,询问天气。还有一部分阐释的就是他家在自然语音处理方面的优势。这些都已经合成在开发者套件里面了。也可以去ai.baidu.com。观看更多详情。
   之后,陆奇亲自讲解了Apollo开放平台的相关细节,就像ppt写的那样子,开放能力,共享资源,加速创新,持续共赢。陆奇也说道,百度会逐步开放apollo平台,让更多的开发者进来,同时宣布跟国内多家汽车厂商合作,同时还有顶尖大学和*的支持。随后讲解了百度的brainABC。具体我就不描述了。
        在主题演讲的最后一位嘉宾李彦宏到场后,对人工智能的又做了一遍阐述。至此上午的主演讲基本完事。
   下午的时候,我参加的是ai技术与开放平台的分论坛,主要分三个部分,第一部分就是对自家语音交互的介绍,是王海峰进行的分享,他介绍了语音的现状,并详细的介绍他们在远场语音识别方面遇到的问题,包括麦克风阵列,腔体结构,波束形成,回声消除等,除了要解决这些问题外,在设置DuerOs系统时,他们也得在离线唤醒,唤醒词设计,低功耗,唤醒灵敏度,误功耗等方面下功夫。并且阐述他们自家的SDK支持多硬件适配,包括树莓派,mtk,全志,高通。也分享了他们在语音合成方面的成果。开放最好的语音合成音色,未来会加入更多明星音的合成。第二部分是赵世奇进行的unit语音理解与交互技术的分享,如果说王海峰分享的是语音识别和合成的技术分享,那么赵世奇的分享是在自然语音生成和自然语音理解的分享。说了这么多那主要应用场景都有哪些呢?应用系统,机器翻译,对话系统,深度问答,这四个方面均有涉猎。那是如何实现这些技术的呢,大数据,知识图谱,机器学习,语言学。至于具体的知识点,网上太多介绍,我就不一一解释。第三部分是林元庆做的分享,我们都知道百度不仅在语音识别领域有研究,在图像方面也进行了研究,那都包括什么呢,林元庆说尽管在静态图理解方面,我们做的已经相当不错了,但是我们的世界是动态的,然而静态图只是一张二维图片,让计算机更好的感知世界,理解世界,于是在视频方面进行了研究,包括视频分割,视频语义理解,人脸识别,机器人视觉等,视频分割的挑战在于,输出信息多,训练数据少。还介绍了视频细粒度的物体识别,和视频结构化等。第四部分是Ar开发平台的介绍,用到了视觉惯性算法,局部和全部的双优化,重定位,求解器,空间复杂度等这些在ai.baidu.com可以查看更详细的内容,并且百度也会举行ar比赛,欢迎更多的人参加。最后一部分是百度自家深度学习平台paddlepaddle,此次平台不仅会开放,还将告诉我们里面进行了那些优化,更多内容要去ai.baidu.com查看。
   以上是本人关于此次大会的总结,下面说一下我自己的感受,在国外互联网相关巨头纷纷投入ai的浪潮下,百度面临的压力还是很大的,为嘛这么说,谷歌,facebook,微软,亚马逊都有自家的深度学习平台,早已经开放好久,或者社区开发者都挺多的,未来会有多少人用百度的深度学习平台,还是一个悬念,但是有个事实就是,如果你开源了,没有人用,那它也算是失败的,当然我们也看到他为了吸引更多的开发者用他们家的平台,它也向全世界宣布,百度会公开更多的数据,不仅是语音方面,还包括自动驾驶方面。百度这次开放确实挺彻底的,不仅开放源码,开放数据,开放免费的多样化套件。我不敢给百度打包票,他成功,或者说他失败,决定权在中国的企业怎么看,开发者怎么看。另外一方面人工智能创业公司太多,说不好那些是泡沫,那些是实干,不过还是那句话ai是个大方向,每个人都想分一羮,但是我认为只有那些专心做技术,努力改善人类生活的质量的公司才能活的更久。而不是那些盲目跟风的企业。