去评论
dz插件网

【有偿求助】Nextcloud搭建问题 - 全文搜索/图片文字检索问题

逝水年华
2024/03/05 21:25:56
目标:
我正试图让 tesseract OCR 能和 fulltextsearch(elasticsearch) 配合使用以搜索nextcloud网盘图片上的文字。

当前的情况:
我已经能通过elasticsearch检索PDF或word文档内的文字了。然而我搜不到图片里的文字。

遇到的问题:
我尝试上传新图片来检查,然后用 fulltextsearch:reset后再次fulltextsearch:index,但就是搜不到。

由于 tesseract 不兼容nextcloud 28,我尝试用nextcloud 27.1.7实施上述操作,php 8.1。其他信息:

elasticsearch服务端:
  "version" : {
    "number" : "8.12.1",
    "build_flavor" : "default",
    "build_type" : "deb",
    "build_hash" : "xxxxxxxxxxxxxx",
    "build_date" : "2024-02-01T13:07:13.727175297Z",
    "build_snapshot" : false,
    "lucene_version" : "9.9.2",
    "minimum_wire_compatibility_version" : "7.17.0",
    "minimum_index_compatibility_version" : "7.0.0"
  },
  "tagline" : "You Know, for Search"
}

Nextcloud相关插件版本:

Full text search        27.0.3        

Full text search - Elasticsearch Platform        27.0.5        

Full text search - Files        27.0.1        

Full text search - Files - Tesseract OCR        27.0.0        


有谁知道如何在Nextcloud上实现搜索图片上的文字? 求大佬回帖提供思路,能代搭解决该问题必有酬谢,联系TG @GlobalMarkMonitor