Elasticsearch实战——全文检索架构设计-FinClip官网

Elasticsearch实战——全文检索架构设计

网友投稿 1139 2022-10-29

Elasticsearch实战——全文检索架构设计

1、题记

近几年，Elasticsearch（以下简称ES）作为开源的搜索引擎已经在国内得到越来越多的应用推广，在日志分析领域应用场景尤为广泛。传统的数据库Mysql、Oracle或者非关系型数据库Mongo作为基础存储的企业要想实现业务数据的全文检索，该如何实现呢？

本文给出架构设计和实现原理。

2、理清楚使用ES的初衷

2.1 大数据背景下数据量的积累与数据应用疲软矛盾一直存在。

大数据的风已经刮了几年，西安交大徐宗本院士也强调“推动大数据产业必须解决好定位、规划、切入点、数据标准、开发共享等问题，互联互通是基础、定制化服务是中心、懂数据会分析是关键”。可见，数据分析的重要性。

传统企业的数据存储存在以下问题：问题1：由于模型受限，传统企业的数据大多存储在关系型数据库Mysql、Oracle，非结构化数据存储在Mongo中。数据量也能积累到TB甚至PB级。

只能进行结构化的检索类似”select * from table where col like ‘%xxx%’显然不能满足纷繁复杂的业务需求。

问题2：数据是死数据，数据的BI可视化展示需要专业团队开发，但不能得到很好的分析效果。

以上问题形成了数据量累计到一定的量，但数据得不到很好的应用分析之间的矛盾。

2.2 在保持基础数据库不动的同时，新增全文检索，更好、更快的从亿万数据中获取检索服务。

不想抛弃原有的数据存储结构，想在原有数据存储的基础上新增全文检索。

3、传统存储模型上的ES全文检索架构

3.1 采集层

解决数据源头问题。业务模型的不同，有的数据是机器设备（软件、硬件）产生的，有的则需要自己开发爬虫（如：python的scrapy）进行互联网全网爬取或者定向网站爬取。

3.2 Mysql基础存储层

基础数据的存储。定义好库表结构、关联关系、主键、外键结构来存储结构化数据。或者非结构化数据，采用Mongo键值对的方式存储。

3.3 ES检索层

实现基础数据的同步。这里是关键，传统的业务模型会在Mysql基础层的基础上，开展业务数据分析通常是以下步骤：

步骤1：后台数据——库表分散的建立视图，对数据做分门别类的统计（基于order by, group by等操作）。

步骤2：前端可视化——通过 Angularjs 进行数据渲染，并通过百度的Echart模型进行可视化展示。

ES检索层的准备如下：方式1.数据同步——基础业务数据由基础库Mysql、Oracle或Mongolia同步到ES中，大多需要借助logstash实现。

方式2.数据同步——数据存成json格式文件，然后借助阿里的fastjson解析，以bulk方式批量导入ES。

3.4 对外接口及可视化层

实现ES全文检索、Tag检索等对外服务、数据的分类统计、排序等可视化展示。 java接口可以参考jest实现。

可视化可以借助kibana实现。这里就体现出elkstack的优势，logstash完成基础数据同步，es完成数据存储和检索，kibana完成数据可视化。

4.架构小结

以上是我研究ES近一年时间的实战总结。其中，ES检索、kibana可视化的深入应用还有很长的路要走。

欢迎就架构问题深入留言探讨！

和你一起，死磕Elasticsearch！

——————————————————————————————————

2017-07-02 09:23 思于家中床前

作者：铭毅天下

在数字化转型中，选择合适的跨平台开发框架不仅能提高效率，还有助于确保数据安全与合规性。

1139 2022-10-29

Elasticsearch实战——全文检索架构设计

洞察掌握android电视app开发中的安全与合规策略，提升企业运营效率

在数字化转型中，选择合适的跨平台开发框架不仅能提高效率，还有助于确保数据安全与合规性。

在数字化转型浪潮中，企业如何通过跨端开发框架提升运营效率，兼顾合规性与数据安全？

最近发表

更多内容

小程序SDK

Finclip技术文档

小程序开发

小程序容器

小程序框架

Finclip小程序平台

Finclip用户投稿

车联网

推荐文章

小程序SDK是什么意思？小程序sdk和插件有什么区别？

小程序支付功能怎么实现？

企业app开发流程是什么？

app运营模式有哪些？

小程序多端引流怎么做？

小程序生态分析的机会和威胁

Flutter入门这一篇效率文章就够了

原生与跨平台解决方案分析,跨平台软件开发技术方案

热更新技术：让软件更新变得更加轻松快速

解决方案

银行解决方案

证券解决方案

互联网解决方案

政企OA解决方案

科技解决方案

loT解决方案

信任解决方案

热评文章

AppCan:基于混合模式的移动应用开发,移动混合模

Hybrid App混合模式开发的了解

小程序容器技术助力券商数字营销突围，小程序容器化的意

用mpvue开发微信小程序基础知识（vue.js开发

小程序多端框架全面测评对比，强烈推荐！

券商app架构 - 解析券商应用程序的构建与设计