当前位置:首页 > 塔罗牌 > 一周国际科技信息速览(第五十七期)

一周国际科技信息速览(第五十七期)

关键词:   发布时间:2019-11-03 08:00:01

国际科技信息速览



人工智能

英伟达利用神经网络实现AI“捏脸”。近日,英伟达的研究人员开发出一款全新的人脸生成器,基于大量真实人像照片,使用新的生成对抗网络(GANS)训练方式,可自动创造出非真实存在却又十分逼真的人物肖像。该系统不需人类监督,可自动将照片分割成各个元素,并由生成网络把这些元素组合成一张图片,然后在对抗网络的鉴别和反馈下,不断改进人物脸型、发型及其他细节,逐步提高图片的真实性,最终迭代生成不同风格的“假脸”。该系统可提供三种不同改动程度的“假脸”生成模式,并支持生成高分辨率图片。

谷歌利用机器学习让用户通过谷歌浏览器指挥AI“乐队”。近日,谷歌开发出让用户指挥交响乐队的名为“半指挥家”(Semi-Conductor)的应用。该应用基于面向姿势估计的PoseNet机器学习算法,无需专门的硬件或软件,仅通过网络摄像头捕捉动作,即可实现检测人物形象以及人体姿势和动作的分析和估计,并生成交响乐,整个过程都在浏览器中完成,无需向谷歌发送任何数据,实现了对用户隐私的保护。用户只需在谷歌浏览器中打开网址,挥舞双臂,就可以指挥 “乐队”。

美国德州大学借助机器学习将单声道音频转为立体声。近日,德克萨斯大学奥斯汀分校与Facebook合作开发出了一套基于机器学习技术的“单声道音频转换”技术。该技术设计出一种深度学习算法,通过分析视频场景中的视觉线索确定声音的方向,估计画面中各个物体的空间位置,并通过模拟声音到达左右耳的时间差异等因素,将普通单声道音频转换成“2.5D视觉立体声”,实现身临其境的音频体验。研究人员表示该技术可以将普通单声道音频更好地运用到虚拟现实装备中,为用户带来更出色的沉浸式体验。

美国与德国研究人员利用AI将大脑活动转换为语音。日前,来自美国哥伦比亚大学、加州大学以及德国不来梅大学的三个研究团队,设计出一个基于神经网络的计算模型,实现将某些大脑活动重建为听众可以理解的单词和句子。该模型通过神经网络分析病人手术时放置在大脑语音规划等区域的电极片读数,构建从电极片读数到音频记录的映射,并实现大脑活动数据的单词重建。实验数据表明,约有超过40%的AI生成单词可以被听众理解,这项研究成果发表在最新一期的《科学》杂志上。


机器人

丰田研发可用于老年人看护的人力保障机器人。近日,丰田推出具备看护、护理以及救援功能的人力保障机器人T-HR3。该机器人配备有轮子、显示器、摄像头、伸缩臂和多种传感器,可举起1.2公斤的重物,并能够通过穿戴设备进行远程操作,让用户通过机器人的摄像头看清周边环境,同时可以进行书架整理、房间清洁和送餐等看护任务或者帮助工人完成灾区救援的特殊作业。丰田机器人项目高管预计,将在未来2-3年内把T-HR3机器人提供给医院和部分家庭。



VR/AR

硅谷公司研发新型AR装备帮助消防员挽救生命。近日,美国硅谷Qwake Tech公司为消防员设计出一款融合神经科学原理和计算机视觉技术的AR装备C-THRU,该装备由头盔、AR投影显示器、高速热成像仪、毒性传感器、噪声消除装置、计算机处理器和远程控制系统构成,通过提取环境数据中的关键细节,可实时预测燃烧建筑物的清晰轮廓,并生成轮廓的3D线框,由AR显示器投射到消防员眼前,实现在烟雾缭绕的环境中提供正确导航信息,帮助消防员迅速做出正确决策。


Snapchat推出宠物狗专属的AR动画滤镜。日前,Snapchat在最新版本的应用程序里,推出了专为宠物狗设计的AR滤镜工具。该工具使用新的视觉算法,只要把镜头对准可爱的宠物狗,算法就可以自动识别并完整匹配小狗的面部,把鹿角、披萨脸、各类眼镜框、鼻头飞舞的蝴蝶以及盘旋在头顶的狗骨头等虚拟装饰自动呈现在小狗脸上,生成带动画滤镜效果的宠物照片。这款专属滤镜可以方便地给不配合拍照的小狗拍出清晰且带动画滤镜的宠物照片,受到了爱狗人士的欢迎。



欢迎转载,请注明出处

长按识别二维码关注我们!


联系方式

地址:  北京市海淀区玉渊潭南路普惠南里13号楼

电话:010-68291903


 



分享 2019-11-03 08:00:01

0个评论

文明上网理性发言,请遵守新闻评论服务协议