基于QT5的网络图片爬虫

以下是一个基于Qt5的简单网络图片爬虫示例代码。这个爬虫使用Qt的网络模块下载图片,并使用QThreadPool来并发下载图片。




#include <QCoreApplication>
#include <QNetworkAccessManager>
#include <QNetworkRequest>
#include <QNetworkReply>
#include <QFile>
#include <QThreadPool>
#include <QRunnable>
#include <QUrl>
#include <QDebug>
 
class ImageCrawler : public QObject {
    Q_OBJECT
public:
    ImageCrawler(QNetworkAccessManager* manager, const QUrl& url)
        : m_manager(manager), m_url(url) {}
 
    void run() override {
        QNetworkRequest request(m_url);
        QNetworkReply* reply = m_manager->get(request);
        QObject::connect(reply, &QNetworkReply::finished, [this, reply]() {
            if (reply->error() == QNetworkReply::NoError) {
                QFile file(QString("image_%1.jpg").arg(m_imageIndex++));
                if (file.open(QIODevice::WriteOnly)) {
                    file.write(reply->readAll());
                    file.close();
                    qDebug() << "Image saved successfully";
                } else {
                    qDebug() << "Cannot open file for writing";
                }
            } else {
                qDebug() << "Error downloading image:" << reply->errorString();
            }
            reply->deleteLater();
        });
    }
 
signals:
    void finished();
 
private:
    QNetworkAccessManager* m_manager;
    QUrl m_url;
    int m_imageIndex = 0;
};
 
class ImageCrawlerPool : public QObject {
    Q_OBJECT
public:
    ImageCrawlerPool(QNetworkAccessManager* manager, const QList<QUrl>& urls, int threadCount = 4)
        : m_manager(manager), m_urls(urls), m_threadCount(threadCount) {
        QThreadPool::globalInstance()->setMaxThreadCount(m_threadCount);
    }
 
    void startCrawling() {
        for (const QUrl& url : m_urls) {
            ImageCrawler* crawler = new ImageCrawler(m_manager, url);
            QObject::connect(crawler, &ImageCrawler::finished, [crawler]() {
                crawler->deleteLater();
            });
            QThreadPool::globalInstance()->start(crawler);
        }
    }
 
private:
    QNetworkAccessManager* m_manager;
    QList<QUrl> m_urls;
    int m_threadCount;
};
 
int main(int argc, ch
none
最后修改于:2024年08月23日 11:39

评论已关闭

推荐阅读

DDPG 模型解析,附Pytorch完整代码
2024年11月24日
DQN 模型解析,附Pytorch完整代码
2024年11月24日
AIGC实战——Transformer模型
2024年12月01日
Socket TCP 和 UDP 编程基础(Python)
2024年11月30日
python , tcp , udp
如何使用 ChatGPT 进行学术润色?你需要这些指令
2024年12月01日
AI
最新 Python 调用 OpenAi 详细教程实现问答、图像合成、图像理解、语音合成、语音识别(详细教程)
2024年11月24日
ChatGPT 和 DALL·E 2 配合生成故事绘本
2024年12月01日
omegaconf,一个超强的 Python 库!
2024年11月24日
【视觉AIGC识别】误差特征、人脸伪造检测、其他类型假图检测
2024年12月01日
[超级详细]如何在深度学习训练模型过程中使用 GPU 加速
2024年11月29日
Python 物理引擎pymunk最完整教程
2024年11月27日
MediaPipe 人体姿态与手指关键点检测教程
2024年11月27日
深入了解 Taipy:Python 打造 Web 应用的全面教程
2024年11月26日
基于Transformer的时间序列预测模型
2024年11月25日
Python在金融大数据分析中的AI应用(股价分析、量化交易)实战
2024年11月25日
AIGC Gradio系列学习教程之Components
2024年12月01日
Python3 `asyncio` — 异步 I/O,事件循环和并发工具
2024年11月30日
llama-factory SFT系列教程:大模型在自定义数据集 LoRA 训练与部署
2024年12月01日
Python 多线程和多进程用法
2024年11月24日
Python socket详解,全网最全教程
2024年11月27日