业界新闻|搜索引擎营销|网站排名优化|网络营销论文|企业上网|互联网国内|互联网国际

IBM开发“Marvel”搜索引擎 真正实现图像搜索


郑州大秦信息技术有限公司         2004-10-16

CNET 科技资讯网 9月30日国际报道:IBM 公司正在开发一种搜索引擎技术,它能够使我们的后代查找重要的新闻记录片,或仅仅获得一些过去的景象。

  IBM 公司的研究人员正在开发一种名为Marvel的搜索引擎,它能够获取目前在互联网上很难获取的音像资料。我们的后代将能够点击比如说是一次总统辩论的样例照片或描述一个场景,从由 电视公司、电影厂商、个人艺术家创造的数以千计小时的音像资料中获得相关的内容。

  尽管象雅虎、Google等搜索引擎也能够用来查找视频和图片资料,但它们并非真正地对文件中的图像进行搜索,而是对附加在图片询问的文字进行搜索,因此也只能搜索数量较少的文件。

  IBM 研究院负责智能信息管理的高级经理史密斯说,为了能够对现在要求人工分类的内容进行索引,我们正在努力在不使用文字或人工的情况下对内容进行索引。

  人工索引需要大量的时间。对30分钟的视频资料进行解析和分类需要约5 个小时。更为糟糕的是,需要分类的信息在呈爆炸性增长。加州大学伯克利分校进行的调查显示,2002年全球电视台共生产了1.23亿小时的节目,其中包括3100万小时的原创节目,相当于70000TB 数据。这还不包括来自安全监视摄像机和家庭用摄像机的内容。

  Marvel能够使用“户外”、“室内”、“城市风景”、“发动机噪音”等描述音像片断中内容的修饰语自动地对内容进行分类。

  Marvel研究小组于8 月末在剑桥大学的一次会议上展示了第一款Marvel原型产品,它能够对包含超过200 小时视频内容的数据库进行扫描,并使用100 种不同的修饰语对内容进行分类。IBM 公司希望在明年4 月份将使用的修饰语数量提高到1000个。

  进行一次查询的时间需要2 、3 秒钟。尽管是基于MPEG-7数据格式的,但Marvel能够对任何标准的视频格式进行扫描。IBM 公司没有公布如何使Marvel成为一种实用的产品,它很可能首先被应用在电视产业内,而不是向消费者推广。

  尽管Marvel从理论上能够自动地对视频和音频文件进行分类,但目前该项目还在人工操作阶段。到明年4 月份,IBM 公司希望能够有一个包含1000个用于对内容进行分类的修饰语清单,其中一部分是通用型的━━例如风景,另一部分则是特指型的━━例如网球、篮球。史密斯表示,1000个修饰语不能包含整个语义空间。

  IBM 公司称,至少还需要3-5 年的时间,它才能够推出成熟的、基于搜索引擎的Marvel产品。




相关文章
Google推出短信服务 通过手机查询搜索结果
Google侵袭亚马逊地盘 搜索引擎增图书搜索功能
全球专业健康类搜索引擎医搜系统闪亮登场
网络营销市场每周分析摘要(中秋国庆版)
搜狐竞价广告按照地区投放
搜狐普通型登录的修改需一周左右的时间
网易公司对网易搜索引擎客户推出“月月礼相送,相约情人节”活动
谁会访问我们的网站?
企业开展网络营销请注意以下问题
网易很有名,以短信及游戏为主,用户群体不适合

网站建设|域名注册|网站推广|网页设计|虚拟主机|中文域名|网站建设方案
开封|洛阳|平顶山|安阳|鹤壁|新乡|焦作|濮阳|许昌|漯河|三门峡|南阳|商丘|信阳|周口|驻马店