分类后端技术下的文章

2024-08-27

跳跃表（skiplist）是一种可以替代平衡树的数据结构，它允许快速的插入、删除、查找操作，所有操作的平均时间复杂度都是O(logN)。在Redis中，ZSet的底层实现就是跳跃表。

跳跃表的主要特点是：

每个节点不仅包含一个指向下一个节点的指针，还可能包含多个指向后续节点的指针，称为“层”（level）。
节点在层中的分布不是连续的，而是通过指针的链式操作来实现。
查找、插入、删除操作可以在对数平均时间内完成。

下面是一个简单的C语言实现的跳跃表节点和跳跃表结构的示例代码：




#include <stdlib.h>
 
// 跳跃表节点结构体
typedef struct skiplistNode {
    int key;
    struct skiplistNode *backward;
    struct skiplistNode *down;
    struct skiplistNode *next[];
} skiplistNode;
 
// 跳跃表结构体
typedef struct skiplist {
    skiplistNode *header, *tail;
    int level;
} skiplist;
 
// 初始化一个跳跃表
skiplist *skiplistCreate(void) {
    int i;
    skiplist *sl = malloc(sizeof(*sl));
    sl->header = malloc(sizeof(*sl->header));
    sl->header->backward = NULL;
    sl->header->down = NULL;
    for (i = 0; i < SKIPLIST_MAXLEVEL; i++) {
        sl->header->next[i] = NULL;
    }
    sl->tail = NULL;
    sl->level = 1;
    return sl;
}
 
// 插入一个节点
void skiplistInsert(skiplist *sl, int key) {
    skiplistNode *update[SKIPLIST_MAXLEVEL], *x;
    int i;
    // 分配一个新节点
    x = malloc(sizeof(*x));
    x->key = key;
    // 生成一个随机层数
    int level = random() % SKIPLIST_MAXLEVEL;
    x->backward = NULL;
    x->down = NULL;
    for (i = 0; i < level; i++) {
        x->next[i] = NULL;
    }
    // 找到每层插入位置的前驱节点
    for (i = 0; i < level; i++) {
        update[i] = sl->header;
        while (update[i]->next[i] && update[i]->next[i]->key < key) {
            update[i] = update[i]->next[i];
        }
    }
    // 建立前后节点的链接关系
    for (i = 0; i < level; i++) {
        x->next[i] = update[i]->next[i];
        update[i]->next[i] = x;
 
        // 如果有下一层，则建立向下的指针
        if (x->next[i]) {
            x->next[i]->backward = x;
        }
    }
    // 更新头部和尾部指针
    if (sl->level < level) {
        sl->level = level;
    }
    if (x->next[0]) {
        x->backward = x->next[0];
        x->next[0]->backward = x;
    }
    sl->tail = x;
}
 
// 查找一个节点
skiplistNode *skiplistSearch(skiplist *sl, int key) {
    skiplistNode *x = sl->header;
    for (int i = sl->level - 1; i >= 0; i--) {
        while (x->next[i] && x->next[i

- 阅读更多 -

Python Masonite CSRF 保护

System

2024-08-27

所有,python

在Python的Masonite框架中，要实现CSRF保护，你需要遵循以下步骤：

确保你的Masonite项目已经安装了cryptography库。
在你的视图文件中，添加CSRF令牌字段到你的表单中。
确保每一个发送到服务器的POST请求都包含了CSRF令牌。

以下是一个简单的例子：

首先，在你的控制器中，确保你的方法被@route装饰器标记为POST请求处理方法：




from masonite.request import Request
from masonite.view import View
from masonite.controller import Controller
 
class YourController(Controller):
    def __init__(self, request: Request):
        self.request = request
 
    def show(self, view: View):
        return view.render('form')
 
    def store(self, request: Request):
        data = request.all()
        # 处理POST数据
        return "Data received"

然后，在你的视图文件form.html中，添加CSRF令牌字段到表单中：




<form action="/your-route" method="POST">
    <input type="hidden" name="_token" value="{{ csrf_token() }}">
    <!-- 其他表单字段 -->
    <button type="submit">Submit</button>
</form>

这样，每次加载form.html页面时，Masonite都会生成一个新的CSRF令牌，并在表单中隐藏字段中发送。当用户提交表单时，Masonite会验证令牌的有效性，以确保请求是由你的应用生成的，而不是潜在的攻击者。

确保在你的config/app.py文件中启用了CSRF保护：




CSRF_ENABLED = True

以上就是在Masonite中实现CSRF保护的基本步骤。

- 阅读更多 -

Redis实现分布式爬虫的方法与应用实例

System

2024-08-27

所有,redis




import redis
from scrapy.utils.project import get_project_settings
from scrapy.crawler import CrawlerProcess
 
settings = get_project_settings()
server = redis.StrictRedis(host='localhost', port=6379, db=0)
 
class RedisSpiderScheduler(object):
    def __init__(self, server, dupefilter_key):
        self.server = server
        self.dupefilter_key = dupefilter_key
        self.df = server
 
    @classmethod
    def from_crawler(cls, crawler):
        return cls(server=redis.StrictRedis(host=crawler.settings.get('REDIS_HOST', 'localhost'),
                                            port=crawler.settings.get('REDIS_PORT', 6379),
                                            db=crawler.settings.get('REDIS_DB', 0)),
                   dupefilter_key=crawler.settings.get('DUPEFILTER_KEY', 'dupefilter'))
 
    def open(self, spider):
        self.server.sadd(self.dupefilter_key, 'seed_url')
 
    def close(self, spider):
        self.server.delete(self.dupefilter_key)
 
    def enqueue_request(self, request):
        if not request.dont_filter and self.df.sismember(self.dupefilter_key, request.url):
            raise ValueError("Request duplicated")
        self.df.sadd(self.dupefilter_key, request.url)
 
    def next_request(self):
        seed_url = self.server.spop(self.dupefilter_key)
        if seed_url:
            return scrapy.Request(seed_url, dont_filter=True)
 
class RedisCrawlSpider(CrawlSpider):
    # ...
 
    def __init__(self, *args, **kwargs):
        super(RedisCrawlSpider, self).__init__(*args, **kwargs)
        self.scheduler = RedisSpiderScheduler.from_crawler(self)
 
    def parse(self, response):
        # ...
 
if __name__ == "__main__":
    process = CrawlerProcess(settings)
    process.crawl(RedisCrawlSpider)
    process.start()

这个代码实例展示了如何使用Redis来实现Scrapy爬虫的调度。首先，我们定义了一个调度器类RedisSpiderScheduler，它使用Redis来存储URL集合。然后，我们定义了一个继承自CrawlSpider的RedisCrawlSpider类，它使用我们定义的RedisSpiderScheduler作为调度器。最后，我们实例化了一个CrawlerProcess并启动了爬虫。这个例子展示了如何将Scrapy与Redis结合，实现分布式爬取。

- 阅读更多 -

postgresql查询慢的排查脚本

System

2024-08-27

所有,数据库

以下是一个简化的PostgreSQL查询慢排查脚本示例：




-- 查询最消耗CPU时间的查询
SELECT pid, usename, datname, query, state, query_start, now() - query_start AS duration,
       round(cpu_time / 1000.0) AS cpu_sec,
       round(memory_usage / 1024.0) AS memory_mb
FROM pg_stat_activity
WHERE state = 'active' AND query NOT ILIKE '%pg_stat_activity%'
ORDER BY cpu_time DESC
LIMIT 5;
 
-- 查询最长运行时间的查询
SELECT pid, usename, datname, query, state, query_start, now() - query_start AS duration,
       round(cpu_time / 1000.0) AS cpu_sec,
       round(memory_usage / 1024.0) AS memory_mb
FROM pg_stat_activity
WHERE state = 'active' AND query NOT ILIKE '%pg_stat_activity%'
ORDER BY duration DESC
LIMIT 5;
 
-- 查询正在等待锁的查询
SELECT pid, usename, datname, query, state, query_start, now() - query_start AS duration,
       waiting, waiting_reason
FROM pg_stat_activity
WHERE waiting = 't' AND query NOT ILIKE '%pg_stat_activity%'
ORDER BY query_start DESC
LIMIT 5;
 
-- 查询最消耗磁盘I/O的查询
-- 需要使用pg_stat_statements扩展来获取更详细的信息
SELECT * FROM pg_stat_statements ORDER BY blk_read_time DESC LIMIT 5;

这个脚本提供了几个关键的查询，用于检测PostgreSQL中可能导致查询变慢的几个关键因素：活跃查询中最消耗CPU时间的、最长运行时间的查询、正在等待锁的查询以及最消耗磁盘I/O的查询。这些查询可以帮助数据库管理员快速定位和解决性能问题。

- 阅读更多 -

Laravel Homestead：使用密码登录虚拟机

System

2024-08-27

所有,php

在使用Laravel Homestead虚拟机时，如果需要通过密码登录虚拟机，可以使用SSH客户端进行连接。以下是如何使用密码登录的步骤：

确保你的Homestead虚拟机正在运行。
找到虚拟机的IP地址。通常，这可以在Homestead的设置文件中找到，或者可以通过在虚拟机内运行ip a命令来查看。
使用SSH客户端，如PuTTY或者通过命令行使用SSH。格式如下：




ssh username@homestead-ip-address

其中username是你在虚拟机中的用户名，默认为vagrant。homestead-ip-address是你的虚拟机IP地址。

输入在Vagrantfile中设置的密码，或者如果你之前设置了SSH公钥认证，则需要提供对应的私钥文件。

以下是一个使用SSH命令登录Homestead的例子：




ssh vagrant@192.168.10.10

如果你的Vagrantfile中设置了密码，你会被提示输入密码。如果设置了密钥，你需要提供对应的私钥文件。

请注意，建议使用SSH公钥认证来提高安全性。如果你还没有设置SSH公钥，可以按照Homestead文档中的指示来生成SSH公钥并添加到虚拟机中。

- 阅读更多 -

Laravel 响应：返回 PDF （文件响应）

System

2024-08-27

所有,php

在Laravel中，你可以使用Response facade来返回PDF文件。以下是一个简单的例子，展示如何生成并返回PDF文件：

首先，确保你已经安装了barryvdh/laravel-dompdf包，这是一个用来生成PDF的非常流行的库。




composer require barryvdh/laravel-dompdf

然后，你可以在你的控制器中添加一个方法来生成PDF并返回：




use PDF;
use Illuminate\Http\Response;
 
public function downloadPDF()
{
    $data = ['title' => 'Laravel PDF Example', 'content' => 'This is a simple example.'];
    $pdf = PDF::loadView('pdf_view', $data);
 
    return $pdf->download('example.pdf');
}

确保你有一个名为pdf_view的视图文件，它是你的PDF模板。

如果你想直接在浏览器中打开PDF文件而不是下载，可以使用stream方法代替download：




public function showPDF()
{
    $data = ['title' => 'Laravel PDF Example', 'content' => 'This is a simple example.'];
    $pdf = PDF::loadView('pdf_view', $data);
 
    return $pdf->stream('example.pdf');
}

这样，当你访问对应的路由时，Laravel会生成PDF并在浏览器中打开它。

- 阅读更多 -

Golang 时间和日期

System

2024-08-27

所有,golang

在 Golang 中，我们可以使用内置的 "time" 包来处理时间和日期。以下是一些常见的操作和示例代码：

获取当前时间：




package main
 
import (
    "fmt"
    "time"
)
 
func main() {
    t := time.Now()
    fmt.Println("Current time:", t)
}

解析时间字符串：




package main
 
import (
    "fmt"
    "time"
)
 
func main() {
    t, err := time.Parse("2006-01-02 15:04:05", "2022-01-01 12:00:00")
    if err != nil {
        fmt.Println(err)
        return
    }
    fmt.Println("Parsed time:", t)
}

格式化时间为字符串：




package main
 
import (
    "fmt"
    "time"
)
 
func main() {
    t := time.Now()
    formatted := t.Format("2006-01-02 15:04:05")
    fmt.Println("Formatted time:", formatted)
}

计算两个时间之间的差异：




package main
 
import (
    "fmt"
    "time"
)
 
func main() {
    t1, _ := time.Parse("2006-01-02", "2022-01-01")
    t2 := time.Now()
    diff := t2.Sub(t1)
    fmt.Println("Difference:", diff)
}

在时间上添加或减去一段时间：




package main
 
import (
    "fmt"
    "time"
)
 
func main() {
    t := time.Now()
    future := t.Add(24 * time.Hour)
    past := t.Add(-24 * time.Hour)
    fmt.Println("Future time:", future)
    fmt.Println("Past time:", past)
}

检查时间是否等于或在另一个时间之前或之后：




package main
 
import (
    "fmt"
    "time"
)
 
func main() {
    t1 := time.Now()
    t2 := t1.Add(10 * time.Minute)
 
    if t1.Equal(t2) {
        fmt.Println("t1 and t2 are equal")
    } else {
        fmt.Println("t1 and t2 are not equal")
    }
 
    if t1.Before(t2) {
        fmt.Println("t1 is before t2")
    } else {
        fmt.Println("t1 is not before t2")
    }
 
    if t1.After(t2) {
        fmt.Println("t1 is after t2")
    } else {
        fmt.Println("t1 is not after t2")
    }
}

以上代码提供了 Golang 中时间和日期操作的基本示例。"time" 包提供了操作时间的多种函数和方法，可以根据需要进行更复杂的时间计算和操作。

- 阅读更多 -

Python3 unittest — 自动化测试框架

System

2024-08-27

所有,python




import unittest
 
class TestExample(unittest.TestCase):
    """Example unit test class."""
 
    def setUp(self):
        """Hook method for setting up the test fixture before exercising it."""
        self.number = 10
 
    def tearDown(self):
        """Hook method for deconstructing the test fixture after testing it."""
        pass
 
    def test_addition(self):
        """Test case for addition."""
        result = self.number + 5
        self.assertEqual(result, 15, "Expected result of number + 5 should be 15")
 
if __name__ == '__main__':
    unittest.main()

这段代码定义了一个测试类TestExample，它继承自unittest.TestCase。在setUp方法中，我们初始化了一个变量self.number。然后我们定义了一个测试方法test_addition，在这个方法中我们测试了加法操作，并使用assertEqual断言来验证结果是否符合预期。最后，如果我们直接运行这个模块，unittest.main()会自动发现并运行在这个模块中定义的所有测试。

- 阅读更多 -

【Spring Boot】Spring Boot解决循环依赖

System

2024-08-27

所有,java

Spring Boot 解决循环依赖的方法是利用 Spring 的 BeanFactory 的懒加载机制。当 Spring 容器在创建 Bean 时，会先创建一个代理对象，只有在调用 Bean 的时候才会注入真正的 Bean。这样就可以解决 Bean 之间的循环依赖问题。

但是要注意，只有在 Bean 的作用域是 prototype 的时候，Spring 才会使用懒加载来解决循环依赖的问题。如果 Bean 的作用域是 singleton，那么就不能解决循环依赖问题。

以下是一个循环依赖的例子：




@Component
public class A {
    private B b;
 
    @Autowired
    public A(B b) {
        this.b = b;
    }
 
    // getters and setters
}
 
@Component
public class B {
    private A a;
 
    @Autowired
    public B(A a) {
        this.a = a;
    }
 
    // getters and setters
}

在这个例子中，A 依赖 B，而 B 也依赖 A，这就形成了一个循环依赖。在 Spring 容器启动的时候，它会先创建 A 的代理对象，然后创建 B，在创建 B 的时候，由于 A 已经是代理对象了，所以可以被注入到 B 中，之后当 A 被实例化完成后，代理对象会被替换为实际的 A 对象。

这样，A 和 B 都可以正常使用对方的依赖，解决了循环依赖的问题。

- 阅读更多 -

Laravel Homestead：安装 MariaDB

System

2024-08-27

所有,php

在使用Laravel Homestead进行开发时，如果你想安装MariaDB，可以按照以下步骤操作：

确保你的Homestead box已经启动。
登录到你的Homestead box。
更新系统包列表：




sudo apt-get update

安装MariaDB：




sudo apt-get install mariadb-server

启动MariaDB服务：




sudo systemctl start mariadb

确保MariaDB在启动时自动运行：




sudo systemctl enable mariadb

运行安全脚本来设置root密码和调整MariaDB的安全选项：




sudo mysql_secure_installation

登录到MariaDB以确保一切正常：




mysql -u root -p

当你完成以上步骤后，MariaDB应该已经成功安装并且可以在你的Homestead环境中使用了。

- 阅读更多 -