题 目:Nonlinear Integrals and Their Applications in Information Fusion and Data Mining
主讲人:王震源教授(University of Nebraska at Omaha, USA)
时 间:2012年11月27日 10:30
地 点:主楼418
主讲人简介:
王震源,1962年毕业于复旦大学数学系,1991年获美国纽约州立大学(Binghamton)博士学位。1962年任教于河北大学。1979至1981年,以访问学者身份在法国巴黎第六大学概率计算实验室和人工智能实验室从事非可加测度的研究。回河北大学后,历任副教授(1983-1986)、教授(1986-2000)、数学系系主任(1985-1990)。自1989年起,先后在美国宾厄姆顿大学(SUNY) 系统科学系、新墨西哥州立大学数学系、得克萨斯大学 (El Paso) 数学系、以及香港中文大学计算机科学和工程学系分别任客座教授/研究员。王震源自2001年起任教于美国内布拉斯加大学(Omaha),现为该校数学系终身教授。王震源曾获河北省科技进步一等奖(1985)、国家科委和劳动人事部颁发的国家级具有突出贡献的中青年科技专家称号(1986)、ISI (美国科学信息研究院, SCI发布者)的经典引文奖(2000)、美国内布拉斯加大学杰出研究和创造性工作奖(2007)等奖励和荣誉称号。他已发表科学论文一百五十余篇,并出版三部专著:Fuzzy Measure Theory(Plenum,1992)、Generalized Measure Theory (Springer, 2008)、Nonlinear Integrals and Their Applications in Data Mining (World Scientific,2010)。他是Fuzzy Sets and Systems等四个国际杂志的副主编或编委。王震源曾任第七、八、九届全国政协委员。
内容简介:
传统的加权平均(或加权和)是处理数据库中各个属性数据时常用的聚合工具,在数学中它能被看作有限空间上的一个经典勒贝格积分。但在使用这一线性聚合工具时,需要一个基本假设:各个属性对某一给定目标的贡献之间没有任何交互作用。这里所说的交互作用完全不同于数理统计中考虑的随机变量的相关性,然而却广泛存在于大量实际问题之中。这就需要引进新的数学概念——非可加集函数(前称模糊测度)——来恰当地刻划这种交互作用。但集函数一旦失去可加性,相关的勒贝格积分就无法定义,加权平均也会产生歧义。于是人们必须引进关于非可加测度的非线性积分来取代传统的线性聚合工具,以便抓住上述交互作用。使用非线性积分于信息融合和数据挖掘(例如多元回归和数据分类等问题)中,能合理解释属性间的关系、把在线性模型中被误认为是随机影响的一部分转化成确定性影响,从而提高解的精度和可信性。但这时问题求解就不能仅用线性代数和其他一些经典数学方法,而必须同时运用遗传算法、伪梯度搜索法等软计算方法,以得到近似最优数值解。这一新的非线性方法能广泛地应用于涉及数据处理的各学科之中。