·设为首页收藏本站📧邮箱修改🎁免费下载专区💎积分✅卡密📒收藏夹👽聊天室
12
返回列表 发布新帖

有个文章内链自动的问题 有兴趣的一起探讨下

评论13

独家记忆Lv.8 发表于 2024-1-30 08:10:17 | 查看全部
作用不大,词多了整篇文章都是超链接
我要说一句 收起回复
创宇盾启航版免费网站防御网站加速服务
CrystαlLv.8 发表于 2024-1-30 08:10:58 | 查看全部
使用jieba-php库进行中文分词

1. 首先,安装jieba-php库。在项目目录中运行以下命令:

```bash
composer require fukuball/jieba-php
```

2. 创建一个名为`nlp.php`的文件,并在其中编写以下代码:

```php
<?php
require_once 'vendor/autoload.php';

use Fukuball\Jieba\Jieba;
use Fukuball\Jieba\Finalseg;

// 初始化jieba分词
Jieba::init();
Finalseg::init();

// 目标关键词
$target_keyword = "名古屋旅行";

// 示例文章
$article = "名古屋七天自由行是一次难忘的经历。我们参观了名古屋城和其他著名景点。";

// 对文章进行分词
$words = Jieba::cut($article);

// 提取名词短语
// 这里我们简化处理,只提取连续的名词作为名词短语
$noun_phrases = [];
$current_phrase = "";
foreach ($words as $word) {
    if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u", $word)) {
        $current_phrase .= $word;
    } else {
        if (!empty($current_phrase)) {
            $noun_phrases[] = $current_phrase;
            $current_phrase = "";
        }
    }
}
if (!empty($current_phrase)) {
    $noun_phrases[] = $current_phrase;
}

// 计算相似度
// 这里我们使用简单的Jaccard相似度
function jaccard_similarity($str1, $str2) {
    $set1 = array_unique(preg_split('//u', $str1, -1, PREG_SPLIT_NO_EMPTY));
    $set2 = array_unique(preg_split('//u', $str2, -1, PREG_SPLIT_NO_EMPTY));
    $intersection = count(array_intersect($set1, $set2));
    $union = count(array_unique(array_merge($set1, $set2)));
    return $intersection / $union;
}

// 计算目标关键词与名词短语的相似度
$similarity_scores = array_map(function ($phrase) use ($target_keyword) {
    return jaccard_similarity($target_keyword, $phrase);
}, $noun_phrases);

// 设置相似度阈值
$threshold = 0.4;

// 为相关短语添加链接
foreach ($similarity_scores as $i => $score) {
    if ($score >= $threshold) {
        // 在这里为名词短语添加链接到目标文章
        echo "Add link to '{$noun_phrases[$i]}'\n";
    }
}
我要说一句 收起回复
拾光Lv.8 发表于 2024-1-30 08:11:46 | 查看全部
你和楼上有几位都没明白我意思,要的是类似于引用的加链接那样,不知道你有没有懂我意思。之所以说不考虑性能,因为数据量比较盘大,直接把数据库拿下来单独写程序处理的
我要说一句 收起回复
婷姐Lv.8 发表于 2024-1-30 08:12:13 | 查看全部
你整个案例/示例看看
我要说一句 收起回复

回复

 懒得打字嘛,点击右侧快捷回复【查看最新发布】   【应用商城享更多资源】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

图文热点
创宇盾启航版免费网站防御网站加速服务
投诉/建议联系

discuzaddons@vip.qq.com

未经授权禁止转载,复制和建立镜像,
如有违反,按照公告处理!!!
  • 联系QQ客服
  • 添加微信客服

联系DZ插件网微信客服|最近更新|Archiver|手机版|小黑屋|DZ插件网! ( 鄂ICP备20010621号-1 )|网站地图 知道创宇云防御

您的IP:3.138.181.90,GMT+8, 2024-11-25 15:01 , Processed in 0.150949 second(s), 93 queries , Gzip On, Redis On.

Powered by Discuz! X5.0 Licensed

© 2001-2024 Discuz! Team.

关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表