关于离散数学二部图的再次思考

2014-09-24  来源:本站原创  分类:考试  人气:0 

最早是10年听baidu的一位老师讲信息检索课程,那一次对离散数学中的“二部图”的使用场景,有了一个真真切切的认识。然后这个概念一直伴随着自己,到现在,并且在不同场所的听课中,去询问个一些讲师,貌似都很“吃惊”“不清楚”“没有做过”。我才知道这就是技术的差距。

应用中,二部图就是语义推荐使用,系统是搜索引擎,数据是二部图结构,参数是“全部海归的7-8个博士、顶级专业人才”。。。。然后带着当时的疑惑,来到这里,四处打听相关技术,然后慢慢理解了,“曾经这是一家运营公司”“曾经这是一家数据库公司”
“曾经这家公司都不怎么用技术的”。。。。

自语语言学+领域学知识+社会学知识构成了“有效推荐”的三大基石。
自语语言初级:分词、词性标注
中级:本体、语料
高级:领域、主体的关联和聚合
领域学:领域热点、核心、焦点价值、商业模式
社会学:用户行为、思考、互动等。

然后综合起来就是,通过自然语言对文本聚类、领域下主体聚合,依赖领域学+社会学的关联参数。
前面已经基本成熟,而后者成为难点。能做到第一点的已经很少,更别说后者了。
所有这一切的工具扭带就是搜索引擎!

想想未来可能就是搜索+推荐的开发或者平台或者应用,自己已经在搜索的路上打滚、积累,并介入文本处理,
是时候做更远的准备了,本体、预料库、领域结构化、领域属性。。。
现在开始准备应该不晚吧,尽管从业界讲是重复的,但在自己、在自己接触理解的部门看,至少3年你是不会有
这种KPI、意识、结果的吧。有点夸张可能!—-这里是指一个平台型的、通用的知识库。

当然,从搜索广告那边看,他们已经有了非常多的工作了。这个可以从www.taobao.com主页搜宝贝的时候,

输入关键词,然后在最上面的那个layout里面就可以看到,对属性的聚合+关联的推荐。聚合直接可以通过搜索

引擎输出,而关联的推荐,目前看可能来自:类目关联性(来自query统计)、关键词关联性(来自query统计)

、领域属性(需要知识库了),类目和关键词的关联,从抽样的手机、女装、水晶
三个关键词来看,效果还是不错的,至少从展示结果的语义看是这样的,实际是否促进点击或者成交还不清楚。对领域属性的关联推荐,应该通过类目关联见接的有体现,同类目下的似乎很一般。例如,我搜
诺基亚,展示的结果中似乎并没有领域的东西,而只是展示
诺基亚的“属性”+诺基亚品牌推荐+非诺基亚品牌推荐。是否需要展示,诺基亚充电器、诺基亚售后服务、诺基亚客服中心?诺基亚批发商?诺基亚电池?

公司从不为追求技术而技术,而是需求推动技术,还并且是出现瓶颈的时候,才开始推动下一个解决方案。
从解决问题优先和资源汇回报情况着手,超过3个月的结果,等不及了,更别说半年甚至一年了,或许是浮躁或者这就是IT的特征,带病前行或者发展经济学,正合当下中国在发展中解决矛盾同出一辙!

理解了并知道怎么做,然后就顺顺的,面对现实坦然而不惊!

相关文章
  • 关于离散数学二部图的再次思考 2014-09-24

    最早是10年听baidu的一位老师讲信息检索课程,那一次对离散数学中的"二部图"的使用场景,有了一个真真切切的认识.然后这个概念一直伴随着自己,到现在,并且在不同场所的听课中,去询问个一些讲师,貌似都很"吃惊""不清楚""没有做过".我才知道这就是技术的差距. 应用中,二部图就是语义推荐使用,系统是搜索引擎,数据是二部图结构,参数是"全部海归的7-8个博士.顶级专业人才"....然后带着当时的疑惑,来到这里

  • 乔布斯走了,苹果会坠落吗? 2014-03-17

    三联生活周刊201142期封面 2004年6月15日,苹果公司在英国.德国和法国发布iTunes音乐商店,乔布斯在伦敦向美国女歌手艾丽西娅·凯斯演示iTunes音乐商店操作方法 2010年11月30日,维珍集团老板理查德·布兰森站在纽约苹果旗舰店门口为iPad做宣传 乔布斯与风险投资家约翰·多尔(摄于2008年) 乔布斯走了 苹果会坠落吗 ? ◎苗炜 封面插图◎张曦 1997年,乔布斯重返苹果,推出了"不同凡想"系列广告,这则广告中出现了爱因斯坦.鲍勃·迪伦.马丁·路德·金.约翰·列农

  • 谈谈Go编程语言,少即是极多 2014-06-28

    作者为Rob Pike,贝尔实验室来的大牛,现在就职于Google.他主导了Go语言的创建工作.下面是正文-- 这是我在2012年6月的Go SF上演讲的文本. 这是一个个人演讲. 我承认,虽然面前的团队让Go诞生并延续,但是我的观点并不代表任何其他Go语言小组成员的意见. 我也想感谢Go SF的组织者提供这个和你们交流的机会. 几星期前我被问起:"你在推出Go的过程中遇到的最大的惊奇是什么?"我立即意识到了答案: 虽然我们希望C++程序员意识到Go是个较好的选择,但是令人意外的是,大

  • 数据库管理中应当破除迷信 2014-01-27

    就此而言,迷信在数据库中作或IT业中不会有容身之地. 开发人员经常要为一些明显的潜在问题写解决方案.但这些做法完全是没有必要和不适宜的. 就拿我一个朋友过去工作过的地方为例.我本要提到他的名字,但对这一点毫无意义.一次我朋友报告了他们应用程序中数据库性能极其低下的情况并且接到处理的任务.经过调查,他发现数据和日志文件在同一个分区,瓶颈就出在那儿.因此他告诉他老板,我们需要把文件放到独立的分区,这样性能将有一个飞跃的提升.就此,他老板回应道,我并不打算将一个未经测试的架构放到我的运行环境中,你首先

  • 分享制作优秀手机应用的6大技巧 2014-06-10

    在日前举办的Mobilize 2011大会上,很多游戏公司的创始人和高级主管上台讲述了他们的产品,并与我们分享了他们在制作应用程序和手机服务中所学习到的东西.而我们从中挑选出了一些最适合的建议.以下是来自于Pandora.Flipboard.Instagram.Hipmunk.Formspring以及Grey Area的六点技巧: 1.不要总是认为必须从HTML5和原生程序中挑选其一 Pandora正在用一种混合的方法去管理他的音乐服务网站以及应用程序.Pandora在上周发行了一个基于HTML

  • 新概念和老概念--新媒体难点系列三 2014-07-01

    系列文章目录索引:<新媒体难点> 在过去的2个月里,上海团队终于从原来的"纸上谈兵"进入了"落地"的过程.这2个月的实践中,充满着各种挑战,无论内部团队.跨团队磨合,还是客户服务的磨合.这2个月的实践中,的确有很多东西可以沉淀下来和大家分享. 但我想还是从"新概念和老概念"这个话题说起吧.这也是上期之后一直没完成的话题. 在目前服务的一个项目中,我们一共给客户提供了5个可执行/可实施的IDEA,一轮轮提,一轮轮被毙,团队和我都几乎处于

  • 解析决策制定因素对游戏设计的影响 2014-10-21

    今天我阅读了一篇发人深思的博文,作者是我很欣赏的一位游戏设计师Chris DeLeon,但是他在文中的一些观点却是我不能苟同的,即他在文中驳回了关于<大蜜蜂>这类型游戏是基于一些有趣的决策而创造出来的论断.(这个论断曾经出现在他早前博文"很多游戏并不只是选择"的回复中.) 我想要果断地回答这个论断:<大蜜蜂>确实是一款基于有趣决策的游戏,而任何包含有"挑战"因素的游戏设置都可以说是基于有趣的决策而制作出来的游戏.我主张采用Sid Meier的

  • 总结手机应用设计的7大误区 2014-12-10

    在<安娜·卡列尼娜>中,列夫·托尔斯泰这样写到,"幸福的家庭都是相似的,不幸的家庭却各有各的不幸."奇怪的是,手机应用领域也是如此. 优秀手机应用通常存在系列共性:精致.操作便捷.美观.能够完成预期操作.而糟糕应用则就千奇百怪. 设计手机应用时,有若干常见误区需要避免.下面是手机应用设计的7个常见罪状: 1. 激进现实主义 img from venturebeat.com 你着迷于应用的力量,但如果你在应用或设计中填充过多内容,那么用户将对你的游戏丧失兴趣. 想想Bump(

  • 电子商务支付流程设计的12个常见错误 2015-02-09

    原文:Losing Customers at the Register:12 Checkout Blunders 作者:Linda-Bustos 译者:耿人杰 译文来自:电子商务支付流程设计的12个常见错误 ------------ 全文的分割线 ------------- 这篇文章来自Palmer Web Marketing的Justin Palmer的投稿.由于他的观点和技巧对在线零售商相当有价值,所以我们很高兴他能将自己的实践分享给Get Elastic.你可以从他的25个系列方式里了解更

  • 某工业企业公共服务平台架构设计 2012-03-09

    平台背景 XXXXXXXX平台需依托现有 IT系统及未来信息系统建设的要求,规划部署公共服务及基础计算资源,要求对现有业务系统平台进行全面的统一规划和翔实的梳理,建立高可用性.高性能的业务服务载体,提供不间断的业务统筹水平和实施监管能力,符合现代 IT 建设运维要求. 系统多样化,采用技术平台也有其多样性,既有集中控管的业务系统,也有分布式运营的生产系统,从技术层面来看,存在多种异构应用服务,异构数据平台等多种计算资源.硬件层面涵盖了多中操作系统及主机环境的服务器和存储系统,网络交换及路由分布涉

  • 分析业务模型-类图(Class Diagram) - 少即是多 - 专注 2012-05-14

    分析业务模型-类图(Class Diagram)(上) 摘要:类图(Class Diagram)可能是用得最多的一种UML图.类图的基本语法并不复杂,你可能最多学习两三天就可以掌握,然而要真正做到活用类图则可能需要几年的功力.类图是锻炼面向对象分析(OOA:Object-Oriented Analysis)和面向对象设计(OOD:Object-Oriented Design)思想的重要的工具,是业务结构建模的重要工具.本章将会有大量的实战练习,你的OOA思想将会接受极大的考验和提升. 大纲: 3

  • 少即是极多 2012-07-21

    转自:酷壳 – CoolShell.cn [感谢网友 @innocentim (Twitter) 投稿] 这是一篇翻译练习.力图保留原意.若有不准确处,求速速指出.猛击此处(墙)看原文.作者为Rob Pike,贝尔实验室来的大牛,现在就职于Google.他主导了Go语言的创建工作.下面是正文-- --------------正文分隔线-------------- 这是我在2012年6月的Go SF上演讲的文本. 这是一个个人演讲. 我承认,虽然面前的团队让Go诞生并延续,但是我的观点并不代表任何

  • 在Mac OSX 下编译 SBCL 1.0.55 多线程版本出错记录+解决 2013-01-18

    在Mac OSX 下编译 SBCL 1.0.55 多线程版本出错记录+解决 首先从这里下载一个最新的 sbcl 1.0.55 的源代码(the source),解压,然后进去执行 sudo sh make.sh --with-sb-thread 结果出现错误,出错信息如下: Air:sbcl-1.0.55 admin$ sudo sh make.sh --with-sb-thread Password: rm -f *~ *.bak *.orig \#*\# .\#* texput.log *.

  • 少即是极多[转] 2013-11-25

    最近在学Go语言,至于为什么学Go语言?有人喜欢他的简洁,有人喜欢他的多线程并发模型,亦或是其他特性.而Go对于我来说是新的开始,如今编程语言有400多种,Go语言站在新的起点上,从新出发.与其修修补补,不如重新开始.Let's Go!欢迎关注我的微博[一起Golang]http://www.weibo.com/letsgolang -------------- 分隔线 -------------- 这是一篇翻译练习.力图保留原意.若有不准确处,求速速指出.猛击此处(墙)看原文.作者为Rob P

  • 表单交互设计之二--校验思考 2014-05-09

    编辑:S++小组 你是否经常碰到在填写表单时,提交无数次却还是无法通过校验的情况:或者你是否在为不知道填写中哪里出现错误而抓狂:再或者你是否碰到过当你填写了一大堆信息,之后点击按钮提交时,校验报错的同时,你发现你所填写的所有的信息都被清空:或者你还碰到过很多很多校验当中出现的问题,那么我们现在就开始进行表单校验设计的思考. 那校验有哪些情况呢? 1. READY? 提到校验,我们往往会联系到提交表单后出现的错误提示类信息,但是其实在填写表单前的提示信息与表单填写校验有着莫大的关系. 此类提示信息

  • 表单交互设计之二--机票搜索的校验思考 2014-05-19

    编辑:S++小组 在前一篇的校验思考中,我们整体概括了一些校验出现的类型,出现的情况,以及校验设计的设计原则与经验.而在具体设计过程中,需要结合产品的业务逻辑,旅游机票预订的全流程,是我碰到过交互逻辑中,相对比较复杂的情况,它的搜索来说也囊括了比较多的输入项,和各种类别的表单控件,因此它的校验情况也相对比较多样化. 我们来探讨下预订机票中的搜索表单 1. 提到校验,我们往往会联系到提交表单后出现的错误提示类信息,但是其实在填写表单前的提示信息与表单填写校验有着莫大的关系.此类提示信息能够帮助用户

  • 关于大型网站技术演进的思考(二十一)--网站静态化处理-web前端优化-下[终篇](13) 2014-05-21

    本篇继续web前端优化的讨论,开始我先讲个我所知道的一个故事,有家大型的企业顺应时代发展的潮流开始投身于互联网行业了,它们为此专门设立了一个事业部,不过该企业把这个事业部里的人事成本,系统运维成本特别是硬件采购的成本都由总公司来承担,当然互联网业务上的市场营销成本这块还是由该事业部自己承担,可是网站一年运维下来,该公司发现该事业部里最大的成本居然不是市场营销的开销,而是短信业务和宽带使用上的开销,是不是有点让人感到意外呢?下面我来分析下这个场景吧. 短信这块是和通讯运营商有关,很难从根本上解决,

  • 关于联系人排序的思考 2014-08-01

    目前,对于联系人的排序,如果不考虑对方的在线状态,一般都是按照音序排序的.所谓音序排序,也就是拼音字母的顺序:首先是按照整个拼音的首字母(26个字母从A~Z)的顺序排列,如果首字母相同,则依次按照声母顺序.韵母顺序以及音调顺序进行排列: 举个例子来说 如: 阿(a) 白(bai):与阿相比,首字母b在a之后,所以"白"在"阿"之后: 包(bao):与白相比,前两个字母ba相同,o在i之后,所以"包"在"白"之后: 本(ben)

  • :创业恩怨后的7个思考 2014-10-11

    我的朋友冀勇庆的又一部著作<狼战>问世了,从翻开第一页开始我就欲罢不能,一口气读完了这部商战小说. 说是小说,里面却有着太多现实的影子.作为关注通信行业超过6年的记者,可以说我经历了书中描述的一切.<狼战>之所以精彩,在于当我们掩卷之后,会陷入不尽的沉思. 1. 创业需要什么方面的能力? 故事由周子强这个主角引起,因为与形同"父亲"的华正奇发生矛盾,负气离开太阳,创建哈勃.虽然周子强在研发方面堪称天才,但运营一个企业,研发只是一个方面,还需要市场.管理.供应链等

  • 关于SOA的思考 到底SOA为什么让CIO永无宁日 2015-02-11

    Eric Newcomer IONA科技公司的首席技术官(CTO),主要负责指导并协调完成公司技术蓝图以及与标准采用.体系架构.产品设计相关的产品战略规划.有26年的计算机从业经验,其中有15年是在DEC/Compaq公司度过的.在DEC/Compaq公司工作期间,他担任了各类公司层技术与管理职位.是制定SOAP1.2标准的全球广域网协会(W3C)XML协议工作组的创始成员,参与编写了W3C Web服务架构规范,编写了Web服务符合应用程序框架(WS-CAF)系列规范,并担任OASIS组织中的W