分布式搜索引擎 ElasticSearch

2010-05-13  来源:本站原创  分类:开源  人气:638 

ElasticSearch 网站 : https://www.elastic.co/

Elastic Search 是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。

ElasticSearch 提供多种语言的客户端 API:

分布式搜索引擎 ElasticSearch

提供 Marvel 可视化监控台:

分布式搜索引擎 ElasticSearch

相关文章
  • 分布式搜索引擎 ElasticSearch 2010-05-13

    ElasticSearch 网站 : https://www.elastic.co/ Elastic Search 是一个基于Lucene构建的开源,分布式,RESTful搜索引擎.设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便.支持通过HTTP使用JSON进行数据索引. ElasticSearch 提供多种语言的客户端 API: Java API - 1.x -  other versions JavaScript API - 2.4 -  other versions G

  • 实时分布式搜索引擎 Solandra 2011-06-06

    Solandra 网站 : https://github.com/tjake/Solandra Solandra (原名为 Lucandra) = Cassandra + Lucene Solandra = Solr + Cassandra Solandra 是一个实时的分布式搜索引擎,基于 Apache Solr 和 Apache Cassandra 构建. 在线PPT演示:https://docs.google.com/present/view?id=d93fq7n_20fnjpp3q2&p

  • 分布式搜索 elasticsearch 概括 2014-01-17

    elasticsearch 概括 (基于互联网) Elasticsearch是一个基于lucene的.开源的.分布式的.RESTful的搜索引擎.Elasticsearch有如下特征: 1. 更快的执行搜索: 2. 安装简单: 3. 完全自由的搜索模式: 4. 可以简单地通过HTTP使用JSON索引数据: 5. 分布式,可对搜索集群: 6. 能够实时搜索: 7. 实现简单地多租户: 8. 等等. 很多时候我们使用Elasticsearch来代替lucene实现搜索,当然,代替的原因是因为其可实现

  • 分布式搜索elasticsearch 配置文件详解 2014-01-17

    elasticsearch的config文件夹里面有两个配置文件: elasticsearch.yml和 logging.yml, 第一个是es的基本配置文件,第二个是日志配置文件,es也是使用log4j来记录日志的,所以logging.yml里的设置按普通log4j配置文件来设置就行了.下面主要讲解下elasticsearch.yml这个文件中可配置的东西. cluster.name: elasticsearch 配置es的集群名称,默认是elasticsearch,es会自动发现在同一网段下

  • 一致性hash和solr千万级数据分布式搜索引擎中的应用 2014-01-16

    互联网创业中大部分人都是草根创业,这个时候没有强劲的服务器,也没有钱去买很昂贵的海量数据库.在这样严峻的条件下,一批又一批的创业者从创业中获得成功,这个和当前的开源技术.海量数据架构有着必不可分的关系.比如我们使用mysql.nginx等开源软件,通过架构和低成本服务器也可以搭建千万级用户访问量的系统.新浪微博.淘宝网.腾讯等大型互联网公司都使用了很多开源免费系统搭建了他们的平台.所以,用什么没关系,只要能够在合理的情况下采用合理的解决方案. 那怎么搭建一个好的系统架构呢?这个话题太大,这里主要

  • 分布式搜索elasticsearch 2013-10-12

    介绍下es的几个概念: cluster 代表一个集群,集群中有多个节点,其中有一个为主节点,这个主节点是可以通过选举产生的,主从节点是对于集群内部来说的.es的一个概念就是去中心化,字面上理解就是无中心节点,这是对于集群外部来说的,因为从外部来看es集群,在逻辑上是个整体,你与任何一个节点的通信和与整个es集群通信是等价的. shards 代表索引分片,es可以把一个完整的索引分成多个分片,这样的好处是可以把一个大的索引拆分成多个,分布到不同的节点上.构成分布式搜索.分片的数量只能在索引创建前指

  • 分布式搜索elasticsearch 安装 2014-01-17

    单机安装 安装我就以自己的项目为主我自己本身就是一下小项目从部署向下 安装步骤: 1. 安装jdk或者jre,然后设置好环境变更JAVA_HOME: 2. 下载elasticsearch,将之解压,到你项目文件下 我的ubuntu 12.4 创建的文件目录 /home/kuvplus/elasticsearch 你可以通过工具下载上传 到文件上然后解压http://www.elasticsearch.org/download/ 我用命令切换到上面路径 wget http://download.e

  • 分布式搜索elasticsearch 集群管理工具head,bigdesk 2014-01-23

    elasticsearch-head是一个elasticsearch的集群管理工具,它是完全由html5编写的独立网页程序,你可以通过插件把它集成到es.或直接下载源码,在本地打开index.html运行它.该工具的git地址是: https://github.com/Aconex/elasticsearch-head 插件安装方法: 1.elasticsearch/bin/plugin -install mobz/elasticsearch-head 2.运行es 3.打开http://loc

  • 分布式搜索elasticsearch 中文分词集成 2014-01-23

    对于索引可能最关系的就是分词了 一般对于es 来说默认的smartcn 但效果不是很好 一个是ik的,一个是mmseg的,下面分别介绍下两者的用法,其实都差不多的,先安装插件,命令行: 安装ik插件 plugin -install medcl/elasticsearch-analysis-ik/1.1.0 下载ik相关配置词典文件到config目录 cd config wget http://github.com/downloads/medcl/elasticsearch-analysis-ik

  • 分布式搜索elasticsearch几个概念解析 2015-04-22

    介绍下es的几个概念: cluster 代表一个集群,集群中有多个节点,其中有一个为主节点,这个主节点是可以通过选举产生的,主从节点是对于集群内部来说的.es的一个概念就是去中心化,字面上理解就是无中心节点,这是对于集群外部来说的,因为从外部来看es集群,在逻辑上是个整体,你与任何一个节点的通信和与整个es集群通信是等价的. shards 代表索引分片,es可以把一个完整的索引分成多个分片,这样的好处是可以把一个大的索引拆分成多个,分布到不同的节点上.构成分布式搜索.分片的数量只能在索引创建前指

  • 分布式搜索elasticsearch配置文件详解 2015-04-22

    配置文件位于%ES_HOME%/config/elasticsearch.yml文件中,用Editplus打开它,你便可以进行配置. 所有的配置都可以使用环境变量,例如: node.rack: ${RACK_ENV_VAR} 表示环境变量中有一个RACK_ENV_VAR变量. 下面列举一下elasticsearch的可配置项: 1. 集群名称,默认为elasticsearch: cluster.name: elasticsearch 2. 节点名称,es启动时会自动创建节点名称,但你也可进行配置

  • 9个基于Java的搜索引擎框架 2014-12-31

    在这个信息相当繁杂的互联网时代,我们已经学会了如何利用搜索引擎这个强大的利器来找寻目标信息,比如你会在Google上搜索情人节如何讨女朋友欢心,你也会在百度上寻找正规的整容医疗机构(尽管有很大一部分广告骗子).那么如果在你自己开发的网站系统中需要能让用户搜索一些重要的信息,并且能以结构化的结果展现给用户,下面分享的这9款Java搜索引擎框架或许就可以帮助到你了. 1.Java 全文搜索引擎框架Lucene 毫无疑问,Lucene是目前最受欢迎的Java全文搜索框架,准确地说,它是一个全文检索引擎

  • 开发垂直门户的分布式搜索引擎系统 2015-03-11

    最近遇到了头疼的事情,就是开发垂直门户的分布式搜索引擎系统时,发现有四种不同应用的分布式搜索引擎: 1.分布式元搜索: 拥有多个单个的搜索引擎, 中心搜索引擎是利用这些分布的单个的搜索引擎的结果进行撮合得到完整的结果. 这样的设计方案要求各个单元的搜索引擎拥有相同的排序算法和基本相同的数据输出结构,以便由中心搜索进行整理. 2.散列分布搜索引擎 根据Query对索引服务器和文档服务器进行散列,做到对于任何的索引词能够准确的定位到具体的索引服务器并从而定位到正确的文档服务器. 3.Peer 2 p

  • 从上百幅架构图中学大型网站建设经验(上) 2014-02-26

    引言 近段时间以来,通过接触有关海量数据处理和搜索引擎的诸多技术,常常见识到不少精妙绝伦的架构图.除了每每感叹于每幅图表面上的绘制的精细之外,更为架构图背后所隐藏的设计思想所叹服.个人这两天一直在搜集各大型网站的架构设计图,一为了一饱眼福,领略各类大型网站架构设计的精彩之外,二来也可供闲时反复琢磨体会,何乐而不为呢?特此,总结整理了诸如国外wikipedia,Facebook,Yahoo!,YouTube,MySpace,Twitter,国内如优酷网等大型网站的技术架构(本文重点分析优酷网的技术

  • 开发者应该了解的API技术清单! 2014-05-02

    近几年,API经济纷纷崛起,无论是国外还是国内,众多厂商积极开放API.从2011年开始,数据通过API开发出来已成为一种趋势,与此同时它也逐渐发成为企业的核心业务.据不完全统计,国外知名站点ProgrammableWeb收录的新API就达到数万个,而且还在不断增长中. 利用丰富的第三方API,开发者轻松构建出一款应用,极大地提高开发效率和开发质量.而对于厂商而言,他们似乎更乐意将API推向市场,比如通过创建API社区.社交网络等,因为这样更有利于把产品推向市场,从而达到共赢. 有人说,有API

  • 架构师接龙 杨海朝VS. 孙立 2014-10-18

    主持人:冯大辉 杨海朝:在错综复杂的庞大系统中,如何避免多条线频繁地发布新代码对线上业务的影响? 孙立:在公司或者业务快速发展的过程中,应用系统的功能越来越丰富,系统模块也变得非常繁杂.由于前期没有进行良好的整体架构,后期又为了快速响应需求,所以系统模块.多个业务线之间的耦合性非常强,很可能代码也不太规范,导致出现发布了A系统的A模块的代码后,B系统的B模块出现了问题,而B系统的B模块开发人员花了一整天的时间才发现问题是由于A系统的某个发布版本导致的.所以可能出现在系统长期运行稳定.压力不大的情

  • Open search .MQS.OAS公测 2014-11-11

    开放搜索服务(OpenSearch)公测 开放搜索服务(OpenSearch)是一款结构化数据搜索托管服务,为移动应用开发者和网站站长提供简单.高效.低成本.稳定和可扩展的搜索解决方案. OpenSearch基于阿里巴巴自主研发的大规模分布式搜索引擎平台,该平台承载了阿里巴巴全部主要搜索业务,包括淘宝.天猫.一淘.1688.ICBU.神马搜索等业务.OpenSearch以平台服务化的形式,将专业搜索技术简单化.低门槛化和低成本化,让搜索引擎技术不再成为客户的业务瓶颈,以低成本实现产品搜索功能并快

  • Impala:新一代开源大数据分析引擎 2015-02-15

    Impala架构分析 Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据.已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎,仍然是一个批处理过程,难以满足查询的交互性.相比之下,Impala的最大特点也是最大卖点就是它的快速.那么Impala如何实现大数据的快速查询呢?在回答这个问题前,需要先介绍Google的Dremel系统,因为Impala最开始是参照 Dre

  • 架构师接龙 孙立VS. 孙朝晖 2015-03-04

    主持人:冯大辉 孙立:你是如何在架构层面,提高开发人员开发效率的?比如通过合理的分层,不同层安排不同能力的开发人员. 孙朝晖:首先孙立老师已经谈到了这个问题的两个核心,第一是合理的分层,第二是让不同能力层次的队伍有机组合. 对于分层,具体到我们的技术体系,可以清晰地分成四个层次,对应四个技术层次,分别是:前端(JavaScript开发).Web应用(PHP开发).中间件(Java开发)和通信与管理基础(C开发).各层有独立的团队,开发人员专注于本层次的技术发展,各层次的开发团队Leader每日进

  • lucene开发必备工具luke介绍 2012-04-30

    本文已经迁移到搞搜索 做lucene开发的,免不了要和索引文件打交道,但是一些二进制的文件我们怎么去看,下面就要隆重的有请luke了 根据百度百科的说法:Luke是一个用于Lucene搜索引擎的,方便开发和诊断的第三方工具,它可以访问现有Lucene的索引,并允许您显示和修改. 我们可以通过luke来进行一般的索引查看和修改操作. 就打个比方,lucene的索引文件就好像是数据库存储的数据文件,luke就是一个DBMS系统,相信都懂的^_^ 首先jdk是必须地,然后直接到googlecode上把