js版得ac自动机算法

AC自动机(Aho-Corasick Automation)是多模式搜索的高效数据结构和搜索算法,可以同时在一段文本中搜索多个模式字符串。以下是一个简单的JavaScript版AC自动机实现的示例:




class TrieNode {
    constructor() {
        this.children = {};
        this.fail = null;
        this.patterns = [];
        this.isWord = false;
    }
}
 
class AhoCorasickAutomata {
    constructor() {
        this.root = new TrieNode();
    }
 
    addWord(word) {
        let node = this.root;
        for (let i = 0; i < word.length; i++) {
            let char = word[i];
            if (!node.children[char]) {
                node.children[char] = new TrieNode();
            }
            node = node.children[char];
        }
        node.isWord = true;
        node.patterns.push(word);
    }
 
    buildFailureLink() {
        const queue = [];
        for (let key in this.root.children) {
            this.root.children[key].fail = this.root;
            queue.push(this.root.children[key]);
        }
 
        while (queue.length > 0) {
            const node = queue.shift();
            for (let key in node.children) {
                const child = node.children[key];
                queue.push(child);
                let failNode = node.fail;
                while (failNode !== null && !(key in failNode.children)) {
                    failNode = failNode.fail;
                }
                child.fail = (failNode === null) ? this.root : failNode.children[key];
                if (child.fail.isWord) {
                    child.patterns.push(...child.fail.patterns);
                }
            }
        }
    }
 
    search(text) {
        let node = this.root;
        let results = [];
        for (let i = 0; i < text.length; i++) {
            while (node.children[text[i]] === undefined && node !== this.root) {
                node = node.fail;
            }
            node = node.children[text[i]] || this.root;
            let temp = node;
            while (temp !== this.root && temp.patterns.length > 0) {
                results.push(...temp.patterns.map(pattern => ({ pattern, start: i - pattern.length + 1, end: i })));
                temp = temp.fail;
            }
        }
        return results;
    }
}
 
// 使用示例
const acAutomata = new AhoCorasickAutomata();
acAutomata.addWord('apple');

评论已关闭

推荐阅读

DDPG 模型解析,附Pytorch完整代码
2024年11月24日
DQN 模型解析,附Pytorch完整代码
2024年11月24日
AIGC实战——Transformer模型
2024年12月01日
Socket TCP 和 UDP 编程基础(Python)
2024年11月30日
python , tcp , udp
如何使用 ChatGPT 进行学术润色?你需要这些指令
2024年12月01日
AI
最新 Python 调用 OpenAi 详细教程实现问答、图像合成、图像理解、语音合成、语音识别(详细教程)
2024年11月24日
ChatGPT 和 DALL·E 2 配合生成故事绘本
2024年12月01日
omegaconf,一个超强的 Python 库!
2024年11月24日
【视觉AIGC识别】误差特征、人脸伪造检测、其他类型假图检测
2024年12月01日
[超级详细]如何在深度学习训练模型过程中使用 GPU 加速
2024年11月29日
Python 物理引擎pymunk最完整教程
2024年11月27日
MediaPipe 人体姿态与手指关键点检测教程
2024年11月27日
深入了解 Taipy:Python 打造 Web 应用的全面教程
2024年11月26日
基于Transformer的时间序列预测模型
2024年11月25日
Python在金融大数据分析中的AI应用(股价分析、量化交易)实战
2024年11月25日
AIGC Gradio系列学习教程之Components
2024年12月01日
Python3 `asyncio` — 异步 I/O,事件循环和并发工具
2024年11月30日
llama-factory SFT系列教程:大模型在自定义数据集 LoRA 训练与部署
2024年12月01日
Python 多线程和多进程用法
2024年11月24日
Python socket详解,全网最全教程
2024年11月27日