标签 golang 下的文章

GoZero微服务个人探究之路添加中间件、自定义中间件

2024-08-16

在GoZero框架中，可以很容易地添加和使用中间件。以下是如何添加和使用中间件的示例。

首先，在你的服务中定义一个全局的中间件管理器：




var (
    Greeter = zrpc.NewServer(
        zrpc.Address(":9000"),
        zrpc.Timeout(time.Second*3),
    )
)

然后，你可以添加GoZero框架内建的中间件，比如日志、超时、限流等：




Greeter.Use(
    zrpc.Logger(),
    zrpc.Recovery(),
    zrpc.Timeout(time.Second*3),
    zrpc.RateLimit(zrpc.RateLimitOption{
        Frequency: 3,
        Duration:  time.Second * 10,
    }),
)

你也可以自定义中间件。自定义中间件需要实现 znet.HandlerFunc 接口：




func MyMiddleware(fn znet.HandlerFunc) znet.HandlerFunc {
    return func(ctx context.Context, req ziface.IRequest) {
        // 在请求处理前执行的逻辑
        fmt.Println("Before request handling")
 
        // 调用下一个中间件或最终的处理函数
        fn(ctx, req)
 
        // 在请求处理后执行的逻辑
        fmt.Println("After request handling")
    }
}

然后，将自定义的中间件添加到服务中：




Greeter.Use(MyMiddleware)

完整示例代码：




package main
 
import (
    "context"
    "fmt"
    "time"
    "github.com/zeromicro/go-zero/zrpc"
    "github.com/zeromicro/go-zero/zrpc/internal/znet"
    "github.com/zeromicro/go-zero/zrpc/internal/ziface"
)
 
var (
    Greeter = zrpc.NewServer(
        zrpc.Address(":9000"),
        zrpc.Timeout(time.Second*3),
    )
)
 
func MyMiddleware(fn znet.HandlerFunc) znet.HandlerFunc {
    return func(ctx context.Context, req ziface.IRequest) {
        // 在请求处理前执行的逻辑
        fmt.Println("Before request handling")
 
        // 调用下一个中间件或最终的处理函数
        fn(ctx, req)
 
        // 在请求处理后执行的逻辑
        fmt.Println("After request handling")
    }
}
 
func main() {
    Greeter.Use(
        zrpc.Logger(),
        zrpc.Recovery(),
        zrpc.Timeout(time.Second*3),
        zrpc.RateLimit(zrpc.RateLimitOption{
            Frequency: 3,
            Duration:  time.Second * 10,
        }),
        MyMiddleware,
    )
    // ... 其他服务启动代码
}

在这个示例中，我们定义了一个名为 Greeter 的RPC服务，并向它添加了内建的中间件和自定义的中间件。这样，每个请求在处理前后都会执行相应的逻辑。

2024-08-16




package main
 
import (
    "fmt"
    "github.com/go-redis/redis/v8"
    "context"
)
 
var ctx = context.Background()
 
func main() {
    rdb := redis.NewClient(&redis.Options{
        Addr:     "localhost:6379",
        Password: "", // 默认没有密码，如果设置了需要填写
        DB:       0,  // 默认数据库为0
    })
 
    // 使用string结构
    err := rdb.Set(ctx, "key", "value", 0).Err()
    if err != nil {
        panic(err)
    }
    val, err := rdb.Get(ctx, "key").Result()
    if err != nil {
        panic(err)
    }
    fmt.Println("key", val)
 
    // 使用hash结构
    err = rdb.HSet(ctx, "hashkey", "subkey", "subvalue").Err()
    if err != nil {
        panic(err)
    }
    val, err = rdb.HGet(ctx, "hashkey", "subkey").Result()
    if err != nil {
        panic(err)
    }
    fmt.Println("hashkey:subkey", val)
 
    // 使用list结构
    err = rdb.RPush(ctx, "listkey", "element1").Err()
    if err != nil {
        panic(err)
    }
    vals, err := rdb.LRange(ctx, "listkey", 0, -1).Result()
    if err != nil {
        panic(err)
    }
    for _, val := range vals {
        fmt.Println("listkey", val)
    }
}

这段代码演示了如何在Go语言中使用go-redis库操作Redis的string、hash、list数据结构。首先创建了一个Redis客户端，然后分别对每种数据结构进行了设置和获取操作，并打印出结果。这个例子简单直观地展示了如何在实际应用中使用Redis的常用数据结构。

Django 自定义中间件(IP限制频率、用户权限)

2024-08-16




from django.utils.deprecation import MiddlewareMixin
from django.shortcuts import redirect
 
class IPRateLimitMiddleware(MiddlewareMixin):
    """
    根据IP地址对访问频率进行限制的中间件。
    """
    def process_request(self, request):
        # 实现具体的频率限制逻辑
        # 如果访问频率超出限制，可以重定向到错误页面或者执行其他操作
        # 示例逻辑（需要结合实际的频率限制逻辑实现）：
        if is_rate_limited(request.META['REMOTE_ADDR']):
            return redirect('/rate-limit-error/')
 
class UserPermissionMiddleware(MiddlewareMixin):
    """
    用于检查用户权限的中间件。
    """
    def process_request(self, request):
        # 实现用户权限检查
        # 如果用户没有权限，可以重定向到登录页面或错误页面
        # 示例逻辑（需要结合实际的权限检查逻辑实现）：
        if not has_permission(request.user):
            return redirect('/login/?next=' + request.path)
 
# 以下是可能的 is_rate_limited 和 has_permission 函数的伪代码示例：
 
def is_rate_limited(ip_address):
    # 检查IP地址的访问频率是否超出限制
    # 返回 True 如果超出，False 如果没有超出
    pass
 
def has_permission(user):
    # 检查用户是否有权限访问资源
    # 返回 True 如果有权限，False 如果没有权限
    pass

这个示例展示了如何创建两个简单的中间件，一个用于限制IP访问频率，一个用于检查用户权限。每个中间件的process_request方法中都包含了示例逻辑，这些逻辑需要结合实际的频率限制和权限检查逻辑来实现。在实际应用中，你需要替换这些示例函数is_rate_limited和has_permission来实现具体的逻辑。

Golang 并发生产者消费者模式

2024-08-16




package main
 
import (
    "fmt"
    "sync"
    "sync/atomic"
    "time"
)
 
type Job struct {
    ID int
}
 
func (j Job) DoSomething() {
    // 模拟耗时操作
    time.Sleep(100 * time.Millisecond)
}
 
func main() {
    var (
        jobs     = make(chan Job, 10)
        wg       sync.WaitGroup
        consumed uint64 // 统计消费的任务数
    )
 
    // 启动3个工人
    for i := 0; i < 3; i++ {
        wg.Add(1)
        go func() {
            defer wg.Done()
            for job := range jobs {
                job.DoSomething()
                atomic.AddUint64(&consumed, 1)
            }
        }()
    }
 
    // 生产一些任务
    for i := 0; i < 10; i++ {
        jobs <- Job{ID: i}
    }
    close(jobs) // 关闭任务通道，通知消费者所有任务已发送
 
    wg.Wait() // 等待所有消费者完成
 
    fmt.Printf("Total jobs consumed: %d\n", consumed)
}

这段代码使用了Go语言的通道（channel）来实现一个简单的生产者-消费者模型。代码中定义了一个Job类型，并且每个Job可以执行DoSomething方法来模拟耗时操作。代码启动了3个goroutine作为消费者，它们不断从通道中获取任务并执行。主goroutine负责生产任务并发送到通道，然后关闭通道通知消费者所有任务已发送完毕。代码使用了sync.WaitGroup来等待所有消费者完成工作，并使用atomic.AddUint64来原子性地增加消费的任务数计数。

go 微服务框架kratos使用中间件的方法

2024-08-16

在 Kratos 框架中使用中间件的方法如下：

定义中间件：创建一个函数，该函件接收 Handler 作为参数，返回一个 Handler。




func MyMiddleware(h http.HandlerFunc) http.HandlerFunc {
    return func(w http.ResponseWriter, r *http.Request) {
        // 在调用原始 Handler 之前执行一些操作
        fmt.Println("Before handling request.")
 
        // 调用原始 Handler
        h(w, r)
 
        // 在调用原始 Handler 之后执行一些操作
        fmt.Println("After handling request.")
    }
}

应用中间件：在服务的启动代码中，使用 Kratos 提供的方法来应用中间件。




func main() {
    // ... 其他初始化代码 ...
 
    // 应用中间件
    httpSrv := httpSrv.NewServer(
        // 其他配置 ...
        httpSrv.Middleware(MyMiddleware),
    )
 
    // ... 启动服务的其他代码 ...
}

在这个例子中，每个经过 MyMiddleware 的 HTTP 请求在处理之前和之后都会打印出相应的日志信息。这就是在 Kratos 微服务框架中使用中间件的基本方法。

基于python美食数据分析系统爬虫可视化 Django框架携程美食（源码）✅

2024-08-16

由于提供的源代码已经包含了完整的解决方案，我将提供一个简化的代码实例，展示如何使用Django框架创建一个简单的网站，并展示如何使用爬虫技术和可视化库来处理和展示数据。




# 导入Django模块
from django.shortcuts import render
from django.http import HttpResponse
import matplotlib.pyplot as plt
import seaborn as sns
 
# 定义一个简单的视图函数，用于生成并显示一个图表
def show_chart(request):
    # 创建一个图表
    plt.plot([1, 2, 3, 4], [10, 20, 25, 30])
    plt.title('Sample Chart')
    plt.xlabel('X Axis')
    plt.ylabel('Y Axis')
 
    # 用内存中的图像文件作为响应返回
    img_data = BytesIO()
    plt.savefig(img_data, format='png')
    plt.close()
    img_data.seek(0)
    return HttpResponse(img_data.getvalue(), content_type='image/png')
 
# 定义一个视图函数，用于展示包含图表的HTML页面
def index(request):
    return render(request, 'index.html')
 
# 定义URL路由
from django.urls import path
 
urlpatterns = [
    path('', index, name='index'),
    path('chart/', show_chart, name='chart'),
]

在这个例子中，我们创建了两个视图函数：show_chart 用于生成图表，并通过Django的 HttpResponse 返回图像数据；index 用于展示一个HTML页面，HTML页面中可以包含一个图像标签来显示图表。这个例子展示了如何在Django中结合使用爬虫技术和可视化库，以及如何通过Django的路由系统来定义URL路由。

Go1.19革命：打造超效能站点模板爬虫

2024-08-16




package main
 
import (
    "fmt"
    "github.com/PuerkitoBio/goquery"
    "log"
    "net/http"
)
 
func main() {
    // 设置代理服务器
    proxyURL, _ := http.NewUrl("http://代理服务器IP:端口")
    http.DefaultTransport.(*http.Transport).Proxy = http.ProxyURL(proxyURL)
 
    // 设置请求头信息
    header := http.Header{}
    header.Set("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3")
    transport := &http.Transport{}
    client := &http.Client{Transport: transport}
 
    // 创建请求
    req, err := http.NewRequest("GET", "http://www.example.com", nil)
    if err != nil {
        log.Fatal(err)
    }
    req.Header = header
 
    // 发送请求
    resp, err := client.Do(req)
    if err != nil {
        log.Fatal(err)
    }
    defer resp.Body.Close()
 
    if resp.StatusCode == http.StatusOK {
        // 使用goquery解析HTML文档
        doc, err := goquery.NewDocumentFromReader(resp.Body)
        if err != nil {
            log.Fatal(err)
        }
 
        // 查询并输出所需信息
        doc.Find(".site-list-con a").Each(func(i int, s *goquery.Selection) {
            href, exists := s.Attr("href")
            if exists {
                fmt.Printf("找到网站：%s\n", href)
            }
        })
    }
}

这段代码展示了如何使用Go语言结合goquery库来抓取一个假设的网站列表页面上的所有网站链接。代码中设置了代理服务器，并添加了请求头信息，以模拟浏览器访问。通过goquery解析HTML文档并查询所需信息，打印出来供用户参考。

Golang爬虫封装_golang 爬虫封装，多线程高并发

2024-08-16

以下是一个简单的Golang多线程爬虫的例子，使用了go关键字来创建goroutines以实现并发下载。




package main
 
import (
    "fmt"
    "io/ioutil"
    "net/http"
    "sync"
    "time"
)
 
var wg sync.WaitGroup
 
func download(url string, ch chan<- string) {
    defer wg.Done() // 在函数退出时通知main()一个goroutine结束了
    resp, err := http.Get(url)
    if err != nil {
        ch <- "Error: " + err.Error()
        return
    }
    defer resp.Body.Close() // 确保关闭resp的Body
 
    body, err := ioutil.ReadAll(resp.Body)
    if err != nil {
        ch <- "Error: " + err.Error()
        return
    }
 
    // 将下载的内容作为字符串发送到通道ch
    ch <- string(body)
}
 
func main() {
    start := time.Now()
    ch := make(chan string, 3) // 创建一个通道，容量为3
 
    urls := []string{
        "https://www.golang.org/",
        "https://golang.org/doc/",
        "https://play.golang.org/",
    }
 
    for _, url := range urls {
        wg.Add(1) // 为每个链接增加一个等待组的计数器
        go download(url, ch) // 创建goroutine下载网页
    }
 
    // 等待所有的goroutines完成
    go func() {
        wg.Wait()
        close(ch) // 确保通道关闭，通知main()所有结果都发送完毕
    }()
 
    // 接收并打印通道中的结果
    for result := range ch {
        fmt.Println(result)
    }
 
    // 报告下载和处理时间
    fmt.Printf("Elapsed time: %s\n", time.Since(start))
}

这段代码创建了一个简单的多线程网络爬虫，使用了sync.WaitGroup来等待所有的goroutines完成他们的工作，并通过通道ch安全地在main goroutine和下载goroutines之间传递数据。通过make(chan string, 3)创建了一个有缓冲的字符串通道，缓冲区大小为3，以允许同时传递最多三个结果，而不会阻塞下载goroutines。

使用Python + Scrapy + Django构建企业级爬虫平台

2024-08-16




# 导入Django模型
from django.db import models
 
# 定义爬虫项目模型
class Project(models.Model):
    name = models.CharField(max_length=200)
    # 其他字段...
 
# 定义爬虫任务模型
class Task(models.Model):
    project = models.ForeignKey(Project, on_delete=models.CASCADE)
    url = models.URLField()
    # 其他字段...
 
# 定义爬虫统计模型
class Statistic(models.Model):
    task = models.ForeignKey(Task, on_delete=models.CASCADE)
    items_scraped = models.IntegerField()
    # 其他字段...

这个例子展示了如何使用Django的模型来定义一个简单的爬虫管理系统的数据结构。每个爬虫项目可以有多个爬虫任务，每个爬虫任务生成相应的统计数据。这个系统可以用来跟踪和管理企业级的爬虫项目。