 |
| |
研究部介绍: |
|
|
普适计算研究部成立于2004年6月,主要由来自普适计算教育部重点实验室和计算机科学与技术系人机交互与媒体集成研究所(简称媒体所)的研究人员组成,重点开展普适计算理论、数字媒体建模、人机交互、多模态智能接口、网络和移动多媒体、普适计算系统软件、新型信息设备、物联网等方面的研究,通过技术转化和产业应用带动学科的进一步发展。 |
| |
主要研究方向: |
普适计算理论与技术
| *
透明计算理论 |
| *
普适计算架构 |
| *
情境感知 |
| *
移动计算 |
| *
智能空间 |
| *
嵌入式系统 |
| *
传感和物联网 |
|
智能媒体处理
| * 计算机视觉与图像处理 |
| *
计算机图形学 |
| *
多媒体编码与检索 |
| *
流媒体 |
|
先进人机交互
| *
多模态接口 |
| *
桌面交互 |
| *
情感计算 |
| *
语音交互 |
| *
脑机接口 |
| *
界面自适应 |
|
队伍情况: |
主任:史元春 博士
计算机科学与技术系 教授
研究方向:人机交互、普适计算
个人主页链接
|
|
|
主要研究人员: |
艾海舟 博士
计算机科学与技术系 教授
研究方向:图像处理、计算机视觉
个人主页链接
|
蔡莲红
计算机科学与技术系 教授
研究方向:人机交互、语音合成
个人主页链接
|
胡事民 博士
计算机科学与技术系 教授,长江学者
研究方向:数字几何、图形学、人机交互
个人主页链接
|
杨士强
计算机科学与技术系 教授
研究方向:多媒体信息处理
个人主页链接
|
张尧学 中国工程院院士
计算机科学与技术系 兼职教授
研究方向:普适计算、主动服务、智能终端
个人主页链接
|
温江涛 博士
计算机科学与技术系 教授
研究方向:多媒体编码、传输、物联网
个人主页链接
|
孙立峰 博士
计算机科学与技术系 副教授
研究领域:多媒体信息处理
个人主页链接
|
陶霖密 博士
计算机科学与技术系 副教授
研究领域:视觉技术、脑机接口
个人主页链接
|
陶品 博士
计算机科学与技术系 副教授
研究领域:嵌入式系统、多媒体
个人主页链接
|
周阅芝 博士
计算机科学与技术系 副研究员
研究领域:普适计算架构、主动服务
个人主页链接
|
贾珈 博士
计算机科学与技术系 助理研究员
研究领域:人机语音交互,情感计算
个人主页链接
|
王禹屏 博士
计算机科学与技术系 助理研究员
研究领域:操作系统
个人主页链接
|
张松海 博士
计算机科学与技术系 助理研究员
研究领域:计算机图形学、绘制技术
个人主页链接
|
崔鹏 博士
计算机科学与技术系 博士后
研究领域:视频分析、社会网络
个人主页链接
|
邸慧军 博士
计算机科学与技术系 博士后
研究领域:计算机视觉
个人主页链接
|
庞一 博士
计算机科学与技术系 博士后
研究领域:视频编码
个人主页链接
|
索岳 博士
计算机科学与技术系 博士后
研究领域:普适计算软件平台、人机交互
个人主页链接
|
徐昆 博士
计算机科学与技术系 博士后
研究领域:计算机图形学
个人主页链接
|
主要研究进展:
智能媒体处理:
* 提出可视媒体智能处理的理论与方法,在特征敏感的几何计算、真实感绘制、图像与视频内容处理等方面取得关键性的理论与技术突破,可有效加快可视媒体获取与传播的速度。
* 深入持续开展图像中人脸对象的研究,包括人脸的检测、配准、标注和检测方法。
* 多媒体高效编码、对等网络流媒体传输协议与系统等网络多媒体关键技术。
和谐人机交互:
* 提出跨平台的多语种可视表现力语音生成方法并建立可视化语音合成系统,支持多语种的参数化语音合成、表现力语音与情感脸像生成。
* 研制出大幅面桌面交互原型系统,支持基于多触点的手势和实物交互、多用户界面管理和新型应用。
普适计算环境:
* 提出透明计算理论,在网络环境中扩展冯诺伊曼结构,实现信息服务与用户终端的存储分离和在线访问,充分提高软件的共享程度和信息服务的安全性、降低管理的复杂性和使用成本。
* 提出普适计算架构,基于泛在设备互联互通互操作和情境感知,主动提供用户在包括有移动、嵌入式设备的普适计算环境中连续、个性化的服务。
重要科研项目:
* NSFC重大计划项目:多人多方对话中的语音分离、内容分析与理解(2009-2011)
* 973项目:可视媒体智能处理的理论与方法(2007-2010)
* 863重点项目:普适计算软硬件关键技术与系统(2009-2010)
重要研究成果一:面向企业应用的新型透明计算网络平台
基于时空扩展冯·诺依曼结构和指令存储和运算分离原理的透明计算系统,能够有效解耦现有计算机软件和硬件之间的紧密绑定关系,从而实现程序和数据、甚至整个计算环境的随需迁移、选择和运行。透明计算系统能够简化系统部署,降低系统维护、管理和安全方面的成本,使用户只需专注使用,而不用关注技术细节,因此是实现普适计算的一种有效可行的模式。面向企业应用的透明计算平台利用UEFI、部分虚拟化、基于DHCP和IP虚拟化的动态调度等技术,能够支持高可靠、高可用、高伸缩的企业应用,从而满足企业用户需求,有效降低企业信息化所需成本。目前该平台能够支持Windows XP和Red Flag 6.2等操作系统和应用,已经在企业等领域得到广泛应用。该成果曾获国家技术发明二等奖。

重要研究成果二:普适计算支撑平台pCore
我们提出的面向普适计算环境的软件支撑平台pCore:1)支持多种异构硬件、网络环境,包括了普适计算设备层(泛在设备的固件通用接口、泛在设备的互联技术)、普适服务层(普适服务的资源管理)、用户层(隐私保护技术、便捷交互界面管理技术);2)软件结构基于扩展OSGi规范;3)成功支持开发了普适计算环境示范应用:信息互联的数字家居、路网中的个人信息服务;4)实现了支持动态设备的普适计算环境模拟环境与测试平台,该平台可支持真实设备与虚拟设备的实时接入。

重要研究成果三:大幅面多用户交互桌面uTable
uTable是一个大幅面多用户交互桌面样机系统,具有大幅高分辨率交互界面,支持多个用户与显示内容的触摸、笔式、手势等多种模态直接交互,并能完全保持桌面原有功用,具有以下创新型研究成果:1)超大幅面的交互桌面系统,显示面积对象线长达4.32米,支持100个以上触点及10支交互笔的并发输入;2)支持笔式、手势和触摸交互的多触点输入姿态模型及理解引擎;3)桌面交互管理系统uTablePlatform及其SDK,基于该平台可快速便捷开发适用于uTable的桌面交互应用,已经开放应用两年并公开提供开源软件。

重要研究成果四:基于几何结构的图像视频处理新方法
我们提出的基于几何结构的图像视频处理新方法(1)引入了一种拓扑保持的梯度网格表示形式,可以使用单一梯度网格来表示任意拓扑的图像区域;(2)利用物体形状信息来高效的检测图像中的相似场景物体,自动计算重复物体之间的层次关系;(3)在图像视频编辑传播中构建并使用层次结构树。提出的一系列创新成果连续发表在图形学顶级刊物ACM Transactions on Graphics上。在此基础上,提出并构建了基于互联网的图像合成系统Sketch2Photo,它可以利用互联网上的资源,将用户输入的带文字标签的手绘草图半自动的转换成一张具有真实感的合成图像,并且该合成图像由多张互联网上搜索到的图像无缝拼接而成。

Sketch2Photo. Left: input sketch; Right: the synthesized image
重要研究成果五:特征敏感的三维数字几何处理
该成果提出特征尺度自适应的积分不变量及特征敏感参数化等基本数学方法,并分析其
几何性质,实现了几何特征的自动识别和编辑,并进一步解决了一系列数字几何处理中的关键问题,为包括数字媒体创作在内的数字内容产业提供了建模工具和开发工具集。研究成果可以应用到包括工业生产、数字文化遗产保护、军事训练、数字娱乐等等诸多领域,具有重大的理论价值和可观的经济社会效益。所培养的博士生来煜坤的博士论文《特征敏感几何处理》获2010 年全国百篇优秀博士生论文奖。

Multi-scale feature detection and classification
重要研究成果六:面向未来Internet的传输层拥塞控制框架TCP-FIT
无线、光纤等新型传输技术不断涌现,同时现有的网络基础设施又不会马上被淘汰,这导致Internet结构变得日益复杂,现有的TCP拥塞控制算法已经不能满足当今Internet的需要。TCP-FIT使用模型分析的方式分别对网络的异构性和TCP拥塞控制算法的传输特性进行建模。提炼出复杂网络环境对TCP拥塞控制传输速率模型的需求,并以需求为指导设计出新的TCP拥塞控制算法。
重要研究成果七:基于压缩传感的图像编码
我们提出了一个基于压缩传感并结合DCT变换和noiselet变换的图像编码算法。DCT信息首先被传送到解码端,然后解码端利用这些信息计算出它即将收到的noiselet系数的位置,因此编码端不再需要直接传送noiselet系数的位置信息,这也是对编码效率的提升。我们同时还研究了noiselet系数的统计特性,并利用这些特性确定了合适的量化方案。该算法获得的PSNR值可大于JPEG编码。
|
|