美国开发出能让普通图片变成D形式的软件
看着你在华盛顿特区度假时的照片,能够激起你对象林肯纪念馆那样真实而空间性地方的回忆。但是要是你居然能够走进你的照片并且再次完全地站在林肯的身边,或者至少在一个电脑屏幕中将你的图片变成三维( D)形式,那是什么样的感觉呢?一项称作Fotowoosh的络服务允诺能够提供这样的体验,这是美国匹兹堡的卡耐基—梅隆大学(arnegie Mellon University)的电脑视觉研究员们慷慨提供的。
卡耐基-梅隆大学机器人学研究院(Carnegie Mellon University Robotics Institute)博士生德里克-赫易姆(Derek Hoiem)在过去一年半时间中解决了如何获得软件来让平面图片转变成能够在电脑屏幕上利用的 D虚拟现实形式。与同事亚历克斯-费罗斯(Alexei Efros )、马绍-赫伯特(Martial Hebert)合作,赫易姆提出了一个机器学习系统,能够根据对面前照片检查而获取的信息识别各种表面和他们的方位。其实,Fotowoosh能够使人以摄影师镜头角度观看照片,这样他或她就能够在不同于照相机感受情况下探望透视图。现在,Freewebs公司要在其站上推出赫易姆软件的一个消费版本。Freewebs是一家博客站,位于美国马里兰州Silver Spring,声称其拥有1400万用户。Freewebs总裁施欧文-彼西弗(Shervin Pishevar)称,他希望络用户将上传成千上万照片到Fotowoosh,同其他的访问者共享图片的 D形式,使这项服务成为他所称作的“ D Flickr”。Flickr当然就是雅虎非常受到欢迎的图片共享和社交站。
彼西弗称,Fotowoosh系统的一个测试版本将于5月份推出。该系统对于室外图片处理得很好。转换图片看起来有点象儿童立体书中的插图:有与立体书中平的页面相应的各种“背景”,垂直面以对背景直角地直立,表现诸如墙壁、树林和车辆等实物。该图象好象在一个页内里装载着一个特别的观察器,移动着摄像机旋转地摇摄出来的 D模式。尽管这个软件确实地将立体多维性增加到旅游者的老照片中,将来它可能还被用于诸如机器人导航或建立真实感 D虚拟世界等的创造。赫易姆称,该软件模仿我们大脑常常发生的错觉,即给出纵深给经常降落在我们视膜上的二维图象。传统的(非立体感的)照相机相比于我们两个眼来说只有一个“眼”。这就是说,他们不能够利用视差来获得一个立体图象。
实际上,视差对 D视觉来说并不被严格地要求,如果你闭上一只眼睛,这世界并不变成平面。大脑利用着所有种类的暗示——如阴影、色彩、动作和我们对地板和墙壁之间或街道与大楼之间的空间关系的知识经验——来推断着深度。赫易姆和费罗斯、赫伯特开发的软件开始通过设法聚合一个二维图象的中的每个象素来把一个图象转变成这类图象。天空通常是最容易的,它是蓝或白色的。大多数照片底部和顶部边缘与地平面结合在一起,这帮助该软件识别地平线。一个多层大楼的窗口时常被安排与一个共同的(透视画的)灭点(vanishing point)平行,这是一个虚拟平面的有力标志。赫易姆并没有讲授该软件的这些规则。该系统基于机器学习(machine-learning)运算法则,就是说它通过认出数百图象统计模式计算出其经验法则,在这数百图象中,地面、天空和垂直面已经由人重新用标签标明。
赫易姆说:“幸运地,我们不必完全地从头开始。在如何表现颜色、质地和结构上,我们有许多工作要做。”对于认出一群线的灭点来说,有一个现有的运算法则。在认出人或者说汽车等实物上,人已经做了许多工作。但谁也不曾思考过也许能够使这些结合起来并且学会一个场景的虚拟几何学。
一旦Fotowoosh识别出一个场景中的主要面,它将利用虚拟实境语言(Virtual Reality Markup Language, VRML)文件格式把这些些联合成一个 D模式。该软件分离去二维图象中的一部分,以该模式把他们粘贴在适当的面上,这种处理方法称作材质贴图。目前,这种完成的模式只能由安装有浏览VRML文件的一个特别扩展的一个络浏览器进行观察。但据彼西弗称,预计于下个月推出的Fotowoosh的一个测试版式本,这种模式将能够利用更为普通的Flash格式来进行显示,而Flash已经被组合进了最为普通的一些浏览器之中。(Fotowoosh首页就有一个视频,可以预览几个简单图象的终端产品。)
现在,该系统不能够很好地把在应当是前景——例如街道场景中的行人——的实物从背景面——例如墙壁——上分开。但是,赫易姆正在此方面进行努力。他说:“一年后或者可能不会超过一年的时间,你们将能够获得一张有着各种汽车和行人的小街的照片并且创造一个 D模式,在这 D模式下,各种汽车和行人都被看成了分开的 D前景实物。”彼西弗称,大约17000人已经加入到该测试软件的试用等待行列中。访问者将能够上传并且把自己的照片转换成 D模式,同时把他们存储在一个集子中。此外,Freewebs会员还可以将所转换成的模式放入他们自己的页中。彼西弗称,关于将其工作推向商业化事宜,Freewebs已经接触了赫易姆,因为它同我们转变各种个人媒体内容的想象紧密结合,这是改变人们所看世界事物和人们认为可能性事物方法的那些技术之一。
最终,赫易姆的工作可能改变机器人使用电脑视觉的方法,通过障碍点缀环境航行于他们的路线。赫易姆称,他和他的同事还正在通过处理某个范围多重照片而致力于创造更复杂的 D模式的方法。另外,他们正在实践一种活生生的 D场景的概念,例如,通过预测摄影师关闭点击后几秒后行人和汽车将要行进的方向而展现一个忙碌的街道。因为Fotowoosh模式与标准的 D格式VRML结合在一起,他们能够容易地被输入其它的 D应用,例如建软件;虚拟世界,例如菩提树实验室(Linden Lab)的“第二人生(Second Life)”;“虚拟地球”系统,如Google Earth和微软的Virtual Earth。利用几个二维照片的这些世界创造结构地图 D建筑物,将是在目前方法上的一个很大进步。
彼西弗称,Freewebs最终将提供一个应用程序编程接口,简称API,使得软件开发商能够利用来创造交互式Web应用程序mashups。当问及他的公司是否已经在同Google或Linden Lab进行类似研究时,彼西弗遮隐地称他们现在对此不作评论。
精神焦虑抑郁消化不良胃胀小孩儿便秘怎么办
快手卖货怎么弄
- 上一页:1月份全国汽车市场价格平稳
- 下一页:西门子首获德国造风电船配套订单
-
千纸鹤有福了!易烊千玺加入两档五四晚会,他的优秀值得大家看见
五四青年人节已经来到,大家对于这天是又是期盼又是鄙视。期盼是因为当晚...
2024-07-11
-
人到中年才忘记:你必须自己度自己!(发人深省)
太皇太后垂青是好的,太皇太后;还有是好的,但世上哪有那么多“太皇太后...
2024-03-07
-
“快活王”王建新近况曝光!戴外套打扮新潮,六天吸粉不到三万
愈加多的艺人转至细预告片应用软件,不仅拓展了演艺事业渠道,也作主了的...
2024-01-26
-
四川教师公招:甘孜招914人,医学系岗位占比99%
2022年6月11日,巴塘人事考试网发布公告,2022年未公开招揽学生914人,其中高...
2023-12-18
-
夏日运动季 选一款动感腕表|封面天天见·逛姐出街
火热春季的到来,非常是激发了大家运动的热忱,让汗水与快乐肆意恣意。无...
2023-12-17
-
富国基金股权转让新进展:山东金融资产豪掷50.39亿元收购富国16.675%股权,回报率高达352.
安邦基金会16.675%持股受让方终于出炉! 之前青岛市国际性信托股份控股(简...
2023-12-02