来自中国公司SenseTime的技术应该是将泰坦尼克的浪漫场景与灾难场景区分开来。尽管大多数人类将杰克和罗斯的绽放爱情与泰坦尼克号的沉没区分开来没有任何问题,但这项壮举对于电脑来说非常复杂。
在周 在旧金山举行的麻省理工学院技术评论会EmTech数字会议的 次演示中,该技术表现良好,并能够正确分类场景。它突出了人工智能的发展,但是在能够理解公共示威之外更复杂的电影场景之前,还需要走多远。
SenseTime和香港中文大学的联合研究实验室主任林大华(他也是助理教授)播放了泰坦尼克号的场景视频,杰克(莱昂纳多迪卡普里奥)轻轻地把罗斯(凯特温斯莱特)像飞行中那样倾斜在注定的客船的船 上。视频下面是 张小图,显示该公司的计算机是否认为这个场景很浪漫或者动作十足。
在推测数据可能来自视频剪辑中数以千计的视频和图像剧照后,计算机确定该场景比“灾难”更加“浪漫”。然后,当林简要展示了泰坦尼克号沉没片断时,计算机很快就认定这个场景更像是 场“灾难”而不是“浪漫”。
中国图像识别juggernaut SenseTime使用AI来分析...泰坦尼克号。电影。红线是浪漫,绿线是灾难。
像深度学习这样的人工智能技术的进步已经导致研究人员“培训”计算机来理解照片和视频中的物体。SenseTime的电脑至少如同演示过的那样,似乎能够理解视频剪辑背后的背景,而不仅仅是识别对象。据报道,像Netflix这样的美国科技公司也在以类似的方式探索人工智能的使用来解析视频,然后向观众展示带有更可能吸引他们的场景的促销剪辑。
林并未解释SenseTime如何教导其计算机区分电影场景的背景,而是更广泛地解释了该公司开发人工智能技术的工作,这些技术可以用来识别人脸表情。
SenseTime将其AI技术出售给中国的“视频服务”,他说,可能是指YouTube的仿冒者。他表示,这些公司客户想知道个人用户喜欢哪些电影场景,以鼓励他们观看更多内容,尽管他没有解释这些公司客户是如何实现这 点的。
当被要求描述美国人可能对中国使用人工智能技术的误解时,林表示该国将面部识别用于政府监控。人权活动人士担心,更复杂的监控摄像头可以识别个人面孔,并创建隐私问题等问题。但是林 小化了潜在的陷阱,认为面部识别仅仅是中国使用人工智能的兴趣的 小部分,人工智能也可以用来改善医疗保健等行业。