|
|
|
|
|
计算机新技术:给我们带来新改变 |
时间:2008/6/24 16:03:26 |
|
3月,对于微软亚洲研究院院长洪小文来说,最兴奋的事莫过于参加“微软技术节”了。 他很认同西安交通大学校长郑南宁院士的感触:“无所不在的计算机,造就了无所不在的微软,同时微软的创造活动加速推动了现在计算机技术在人的社会及生产活动的各个方面的渗透。” 此次技术节,微软亚洲研究院带去了不少令世界IT同行感到振奋的“中国创新”,他们的创新技术,也让世界各地来访的记者为之啧啧称赞。 笔者试着解读其中之二三,以飨广大读者。 动态烟实时测绘:让电影烟雾效果更形象 创意由来:很多爱玩游戏的朋友都有同感,做得越接近真实世界的游戏画面越能引人入境。而其中表现自然现象的哪怕一个小细节,背后所蕴含的都是巨大的数据运算量。 现在表现建筑光的特效技术都已经成熟,但是,诸如云、烟、水、皮肤等越是自然的东西却越难表现得真实。 烟的绘制是计算机图形学中一个具有挑战性的问题,因为光在烟中的传播非常复杂。于是,微软亚洲研究院网络图形组的研究员周昆和副研究员任重,就想实现“动态烟的实时测绘”。 任重对记者解释,在布满烟的三维空间中,光在每一点都会被吸收或者散射,由于烟在空间中的不规则性,空间中每一点的吸收和散射程度都是不相同的。 即使是对一个静止的烟,这些吸收和散射的次数和复杂度都会带来庞大的计算“开销”,对于动态烟来说,这种计算代价更为昂贵。也就是说,“实时”的难度,在于获得大数据量的处理能力。 据了解,这项技术在全世界范围,属于国人“首创”。 按照以往的技术水平,每20秒的动态烟的数据处理量要达到4—5个G,而任重小组创新了一种实时烟的绘制算法,可以减少10—20倍的数据量。如果做个简单的计算,原来用1-2天来处理复杂实时光源,现在只用几秒就可以解决了。 这样,电影导演就可以在拍摄现场加入想要的烟雾效果,而不需后期大量的离线绘制后再回放成动画了,游戏也是如此。 那么,除了电影和游戏,还有哪些应用领域呢?微软亚洲研究院常务副院长郭百宁说,“防火门和指示灯的设计也需要用到这个技术”———一旦发生火灾大家都会沿着指示灯标注的路去逃生,大家知道火燃起来就有烟雾,烟雾会在这里面到处跑,这些标志到时候还能不能看到呢?所以在设计的时候就需要模拟烟雾的扩散路径。 洪小文补充说:“现在非常通用的航空模拟器,也需要用到这个技术。”在美国考飞机驾照的人非常多,因此美国很流行航空模拟器,但是里面有一个东西做得不好———就是云雾。“为什么这个东西重要呢?实际上飞机出事就是因为云雾等恶劣天气导致的。怎么让飞行模拟器做到更真实化,在那种情况下能够辨别你的飞行方向是正确的呢?这个动态烟的实时绘制技术就很重要了。 能说会唱的小人头:让您时时刻刻听“演讲” 创意由来:我们很早以前就通过看电影,或者读科幻小说知道了“机器人”这个名词了,但是到目前为止,真正能够动起来的机器人还只是按照一定程序作机械运动的流水线机器人。 当然,要真正实现机器人的仿真化还需要有很远的路要走,但是,能不能让个人电脑这种机器,在某种程度上像人一样能说会唱呢? 这就是微软语音组的最初想法,负责研发的是两个女研究员,她们的头儿叫宋哥平。 记者看到,在计算机屏幕上,一个卡通形象演唱一首流行音乐《喜唰唰》,每一句歌词都和小人头的嘴形相对应,真是个“能说会唱的小人头”。 据钱瑶研究员介绍,这种技术集中展示了一个新的音频/视频的人机界面。这个活泼可爱的小人头背后,是一个复杂的统计模型,它可以将文字转成语音,将词与谱转换成歌唱。此外,头部动作与嘴形同步的视频信号也与说/唱的音频信号一同播放。 也就是说,只要你输入一段文字、或者一段词和相关的谱,小人头就会绘声绘色地给你演讲,或者欢快地一边摇头一边唱歌。 能让小人头说话,是基于用一个统计模型进行批量资料的学习和训练的结果,而能让小人头摇头晃脑并对准口型,也是通过在学习相关视频资料中,因韵律变更而产生相应的发音口型。 还不等科研人员说出来,记者们已经在你一言我一语地帮着想这个技术的应用领域了。 “比如,在公共场所有很多人需要接待员重复同样一段话的时候,就可以把这个小人头搬上去,据研究员介绍,小人头的形象是可以根据不同需要而变化的”;“再比如,你可以在开车上路之前,从网络上下载一些当日的新闻,然后一边开车,一边享受小人头给你播送的最新消息”;“还比如,有些失聪的残障人士需要学习发音,可以用小人头一遍一遍不厌其烦地教会他们读唇直至学会说话。”…… 可视化电子地图:以动画形式重现旅游经历 创意由来:不知道你有过这样的烦恼没有。某一天,您跟家人到北京好几个景点玩了一圈,回家后通过上传照片到自己的博客里想分享给朋友们,但是朋友要想看全它们还是需要不断地打开不同时间、不同主题的博客页,这些照片看起来还是非常零碎而无章法。怎么能让朋友直观地、方便地认同你的感受呢? 有这种困扰的人不在少数,搜索组的郑宇也很早就意识到,这已经成为一个问题———随着GPS设备,如GPS手机、PDA在人们日常生活中逐渐普及,大量的GPS数据正伴随着照片、视频等多媒体数据而不断积累。他和同伴所要做的,就是管理好并利用这些数据为人们提供更有利的服务。 这种技术被命名为GeoLife,它是以GPS数据为中心,并基于电子地图的应用系统。它不但是可视化、管理和理解个人旅行经历的工具,也是多个用户共享GPS数据和交流生活经历的平台。 基于用户拍摄的照片和相关的GPS数据,GeoLife可在地图上以动画的形式生动地重现用户的旅游经历,既有助于自身对过去往事的回忆又方便了朋友之间的生活经历分享。此外,从多人的数据中,GeoLife可以有效地发掘热点区域和经典的旅行线路,并推荐给游客。同时,GeoLife可以帮助用户快速找到特定区域和/或时间段的轨迹。 该搜索不但有助于用户从他人的数据中高效发掘出自己感兴趣的经历,也有利于个人从自己模糊的记忆中快速激发想要回忆的事件。 比如,用户可通过空间搜索功能查看他人在颐和园区域内拍摄的照片和视频,从而为自己日后的行程安排积累丰富的经验。此外,基于时间段的查询方式,用户也可发掘他人在圣诞节期间的有趣经历。在2008年奥运会期间,大量的外国游客将来到北京,此时,GeoLife提供的基于时间和/或空间的搜索功能将为外国游客消除语言障碍,并帮助他们快速获取自己想要的信息。 总之,通过搜索地图,用户可以反思自己的过去并规划自己的未来。 ■新闻缘起 最近,微软技术节在美国微软总部开幕。微软亚洲研究院携45项最新研究成果参展,这些成果涉及多媒体技术在互联网的应用、网络信息处理等广阔领域。可观的参展技术数量和创新的研究成果,使微软亚洲研究院再次成为备受瞩目的焦点。 被誉为“计算机研究领域盛宴”的微软技术节是微软研究院年度最大的活动,其主要目的就是让微软产品部门可以零距离接触各种最新技术,从而为技术向产品转化提供便利。 ■记者手记 不断变革的新技术给我带来快乐 很多年前,我想要一台计算机,但又不知道拿它干什么;后来,当我有了一台计算机,就逐渐知道了它能干什么。是不断变革的新技术教会了我享受计算机带来的快乐。 “技术创造需求”。这句话放在这里似乎很合适。然而,我仍然认为,计算机新技术的神秘在于,你几乎永远不能准确地知道,今天的创造能给明天的人类带来怎样的改变。 美国著名电视栏目《科学美国人》主持人艾伦·奥德说———“我们正在建立一个由计算机组成的社区,人们既对这个社区贡献知识,又从中吸取知识”。 是的,自从以互联网为代表的计算机革命出现,到现在,人们在瞬间可获得的知识已经成几何倍数增长,而且还将不断增长下去。生于“计算机时代”,我应该感到庆幸。 但是,蕴藏在互联网和计算机里的海量数据中,能够被有效用于分析和解决问题的数据有多少?能够让计算机社区中的人们顺畅沟通甚至相互协作的智能工具又有多少? 数据毕竟是对孤立事件的描述,而应用数据的人则是社会性动物,只有让数据活起来,变成社会运行不可缺少的一部分,我们及我们的后人才可以说,这是个真正伟大的时代!
|
|
|