博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
postgresql 全文搜索
阅读量:6904 次
发布时间:2019-06-27

本文共 854 字,大约阅读时间需要 2 分钟。

hot3.png

在项目中,遇到了一个存储文本的字段, 页面上展示的时候, 是一个查询字段

之前用的 的是  ilike 这样的查询方法, 在数据量过100万的时候, 查询基本没有效率.

例如    "   where  content ilike  '%more%';   

通过学习pg的手册,   12 章节中的内容,

尝试了如下2中方法:

SELECT 'a fat cat sat on a more and ate a fat rat' :: tsvector @@ 'more' :: tsquery;        这种返回的结果为 t,  ①

SELECT to_tsvector('dfsjalfjsl more dflasjfl top') @@ plainto_tsquery(' more ');   这种返回的结果为f,  ②

特别注意如上的写法,经过大量数据的测试下,  使用了① 方法,

如果要写在 where 条件中, 

例如 :  wher content::tsvector@@'more'::tsquery    

说明 :  content 这个是你的文本存储的字段,  大概意思就是, 将字段做一次数据上的处理,  tsvector 是那个做数据处理的函数,

'more'  是你要搜索的关键词,   这个没啥好解释的

 

使用的场景 :

1   ilike 比较适合模糊的匹配, 而本文提供的方法是一种比较精确的,  欢迎大家去测试

2   效率的问题,  ilike 在数据量大的情况,   查询速度不是一般慢,数据量过100万的时候,  而本文提供的方法则速度很快,  

 

暂时还没有测试出有没有其他未知的隐患,  欢迎大家来信交流学习.

由于没有经过大量的测试,导致本文中以上的结论失效了, 

在实际的项目中,  我用了  where  to_tsvector(content)@@to_tsquery('more');   

content 为要搜索 的表字段,  more 为搜索的关键词, 

转载于:https://my.oschina.net/u/1579560/blog/3054626

你可能感兴趣的文章
Form 对象
查看>>
Codeforces Round #533(Div. 2) C.Ayoub and Lost Array
查看>>
HDU - 3966-Aragorn' Story(树链剖分+线段树)
查看>>
Linux基础第五章 进程控制
查看>>
jquery事件机制扩展,jquery鼠标右键事件。
查看>>
计算机专业术语
查看>>
Leetcode-探索 | 移动零
查看>>
Tesseract+opencv+VS+win实现OCR
查看>>
[学习笔记]博弈论
查看>>
python os sys模块(二)
查看>>
Innodb间隙锁,细节讲解(转)
查看>>
Apache安装
查看>>
关于对char类型数据赋予负值的汇编表现
查看>>
win10安装MarkdownPad 2报错This view has crashed的处理及md简单语法
查看>>
Windows聚焦转为图片
查看>>
POJ NOI0101-09 字符菱形
查看>>
[转载] 信息系统项目管理师考试习题——整体管理
查看>>
LC 425 word squares
查看>>
Web框架之Django_08 重要组件(form组件、cookie和session组件)
查看>>
HDU 6103
查看>>