分类后端技术下的文章

2024-08-13

在Python中，可以使用os模块中的getcwd()函数来获取当前工作目录的完整路径。

示例代码：




import os
 
current_directory = os.getcwd()
print("当前工作目录是:", current_directory)

这段代码将会打印出当前工作目录的完整路径。os.getcwd()函数不需要任何参数，它直接返回当前进程的工作目录。

- 阅读更多 -

python pip install 按照国内镜像源（清华镜像源）

System

2024-08-13

所有,python

要使用Python的pip命令安装包时使用清华大学的镜像源，你可以通过以下方式指定镜像源：




pip install -i https://pypi.tuna.tsinghua.edu.cn/simple some-package

将some-package替换为你想要安装的包名。

如果你想要将清华大学镜像源设置为默认源，可以创建或修改配置文件pip.conf。配置文件位置依操作系统而异：

Unix系统（非Windows）：在用户主目录下创建或修改.pip/pip.conf（Linux 或 macOS）或者~/.config/pip/pip.conf（Windows）。
Windows系统：在用户主目录下创建或修改pip.ini，通常是%HOME%\pip\pip.ini。

在配置文件中添加以下内容：




[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple

之后，你可以直接使用pip install命令安装包，pip会自动使用配置好的清华大学镜像源。




pip install some-package

- 阅读更多 -

版本匹配指南：Scipy版本、Python版本和Numpy版本的对应关系

System

2024-08-13

所有,python

Scipy是Python中用于数学、科学和工程计算的库。Scipy依赖于Numpy来处理数组，并且对Python版本有特定的要求。以下是Scipy各个版本对应的Python和Numpy版本：

Scipy版本Python版本Numpy版本

1.7.x3.7, 3.81.18, 1.19

1.6.x3.6, 3.7, 3.81.15, 1.16, 1.17, 1.18

1.5.x2.7, 3.5, 3.6, 3.71.9 - 1.14

1.4.x2.7, 3.4, 3.5, 3.6, 3.71.7 - 1.13

1.3.x2.7, 3.4, 3.5, 3.61.5 - 1.12

1.2.x2.7, 3.4, 3.51.4 - 1.11

1.1.x2.7, 3.4, 3.51.3 - 1.9

1.0.x2.7, 3.4, 3.51.2 - 1.8

0.19.x2.7, 3.4, 3.51.1 - 1.7

0.18.x2.7, 3.41.1

如果你需要安装特定版本的Scipy，你可以使用pip命令指定版本号：




pip install scipy==1.7.1

同时，确保你安装的Scipy版本与你的Python和Numpy版本兼容。如果不确定，你可以查看Scipy的官方文档或者PyPI页面获取最新的兼容信息。

- 阅读更多 -

Python流式输出实战：详解实用技巧

System

2024-08-13

所有,python




import sys
 
# 定义一个简单的装饰器，用于计时函数执行时间
def timer(func):
    def wrapper(*args, **kwargs):
        start = time.time()
        result = func(*args, **kwargs)
        end = time.time()
        print(f"{func.__name__} 运行时间: {end - start:.2f}秒")
        return result
    return wrapper
 
# 定义一个简单的生成器函数，用于模拟大量数据的处理
@timer
def process_data(lines):
    for line in lines:
        # 这里只是示例，实际应用中可以进行复杂的处理
        yield line.upper()
 
# 在Python 3中，可以直接使用sys.stdout来进行流式输出
@timer
def stream_output(lines):
    for line in lines:
        sys.stdout.write(line)
        sys.stdout.flush()
 
# 使用示例
data_lines = ["行1\n", "行2\n", "行3\n"]
processed_lines = process_data(data_lines)
for line in processed_lines:
    print(line, end='')  # 此处不使用list()是因为要保持流式输出
 
# 输出文件对象，可以是任何实现了write()方法的对象
output_file = sys.stdout
stream_output(process_data(data_lines))

这段代码首先定义了一个装饰器timer来计算函数执行时间，然后定义了一个生成器函数process_data来模拟数据处理。在stream_output函数中，使用sys.stdout进行流式输出。最后，给出了一个使用示例，展示了如何处理一系列数据并进行流式输出。

- 阅读更多 -

Python酷库之旅-第三方库Pandas(036)

System

2024-08-13

所有,python




import pandas as pd
 
# 创建一个简单的DataFrame
data = {'Name': ['John', 'Anna', 'Peter', 'Linda'],
        'Age': [28, 23, 34, 29]}
df = pd.DataFrame(data)
 
# 打印DataFrame
print(df)
 
# 将DataFrame导出到CSV文件
df.to_csv('output.csv', index=False)
 
# 从CSV文件读取数据到新的DataFrame
df_from_csv = pd.read_csv('output.csv')
 
# 打印新的DataFrame
print(df_from_csv)

这段代码展示了如何使用pandas库创建一个简单的DataFrame，并将其导出为CSV文件，然后再从CSV文件读取数据到新的DataFrame。这个过程是数据处理和分析的常见步骤，pandas库提供了丰富的功能来处理和分析数据。

- 阅读更多 -

分布式定时任务 Elastic Job 高级使用篇

System

2024-08-13

所有,分布式




public class ElasticJobDemo {
    public static void main(String[] args) {
        // 配置作业执行环境
        JobEnvironmentConfiguration jobEnvironmentConfig = new JobEnvironmentConfiguration.Builder("executorService")
                .setCron("0/5 * * * * ?") // 设置作业的CRON表达式
                .setJobExecutionEnvironment(JobExecutionEnvironment.EXECUTOR) // 设置作业的执行环境
                .build();
 
        // 配置作业执行时间策略
        JobConfiguration jobConfig = new JobConfiguration("myJob", 3, "0/10 * * * * ?");
 
        // 配置作业
        ElasticJob elasticJob = LiteJob.newBuilder(new SimpleJob())
                .init(jobConfig, jobEnvironmentConfig)
                .register(createRegistryCenter()).build();
 
        // 启动作业
        elasticJob.schedule();
    }
 
    private static RegistryCenter createRegistryCenter() {
        CoordinatorRegistryCenter registryCenter = new ZookeeperRegistryCenter(new ZookeeperConfiguration("localhost:2181", "elastic-job-demo"));
        registryCenter.init();
        return registryCenter;
    }
}
 
// 实现作业逻辑的类
class SimpleJob implements ElasticJob {
    @Override
    public void execute(ShardingContext shardingContext) {
        // 实现作业的具体逻辑
        System.out.println(String.format("作业执行：%s | 分片参数：%s | 分片总数：%s | 分片索引：%s",
                new Date(), shardingContext.getShardingParameter(), shardingContext.getShardingTotalCount(), shardingContext.getShardingItem()));
    }
}

这个代码示例展示了如何使用Elastic Job框架配置和启动一个简单的分布式定时任务。它设置了作业的执行环境、配置了作业的分片策略和定时执行策略，并实现了作业的具体逻辑。这个例子是基于Elastic Job的使用，但具体的类和方法可能因Elastic Job版本不同而有所差异。

- 阅读更多 -

SpringBoot+Session+redis实现分布式登录

System

2024-08-13

所有,分布式

在Spring Boot中，使用Spring Session和Redis实现分布式登录可以通过以下步骤实现：

在pom.xml中添加依赖：




<!-- Spring Boot Starter Data Redis -->
<dependency>
    <groupId>org.springframework.boot</groupId>
    <artifactId>spring-boot-starter-data-redis</artifactId>
</dependency>
<!-- Spring Session for Redis -->
<dependency>
    <groupId>org.springframework.session</groupId>
    <artifactId>spring-session-data-redis</artifactId>
</dependency>

在application.properties或application.yml中配置Redis服务器：




# Redis服务器地址
spring.redis.host=localhost
# Redis服务器连接端口
spring.redis.port=6379
# 连接池最大连接数（使用默认值即可）
# spring.redis.pool.max-active=8
# 连接池最大阻塞等待时间（使用默认值即可）
# spring.redis.pool.max-wait=-1
# 连接池中最大空闲连接
# spring.redis.pool.max-idle=8
# 连接池中最小空闲连接
# spring.redis.pool.min-idle=0
# 连接超时时间（毫秒）
# spring.redis.timeout=0

配置Spring Session使用Redis：




@Configuration
@EnableRedisHttpSession(maxInactiveIntervalInSeconds = 3600)
public class SessionConfig {
}

创建登录接口，并在登录成功后将用户信息存入session：




@RestController
public class LoginController {
 
    @PostMapping("/login")
    public String login(@RequestParam String username, HttpSession session) {
        // 登录逻辑...
        session.setAttribute("username", username);
        return "Login successful";
    }
}

配置Spring Security以使用Redis存储会话信息：




@Configuration
public class SecurityConfig extends WebSecurityConfigurerAdapter {
 
    @Autowired
    private RedisTemplate<String, Object> redisTemplate;
 
    @Override
    protected void configure(HttpSecurity http) throws Exception {
        http
            // ... 其他配置 ...
            .and()
            .sessionManagement()
            .sessionCreationPolicy(SessionCreationPolicy.IF_REQUIRED)
            .maximumSessions(1)
            .expiredUrl("/login?expired");
    }
 
    @Bean
    public CookieSerializer cookieSerializer() {
        DefaultCookieSerializer serializer = new DefaultCookieSerializer();
        serializer.setCooki

- 阅读更多 -

分布式事务Seata源码解析十：AT模式回滚日志undo log详细构建过程

System

2024-08-13

所有,分布式

在Seata中，AT模式下的分支事务回滚是通过构建回滚日志（undo log）来实现的。当分支事务执行失败或者需要回滚时，Seata会生成相应的回滚日志并将其持久化。

以下是构建回滚日志的大致步骤：

在分支事务开始时，Seata会创建一个BranchSession对象来表示该分支事务。
当分支事务执行完毕并准备提交时，Seata会检查业务SQL的执行结果。
如果业务SQL执行失败，Seata会生成回滚操作的相关信息（比如回滚SQL和回滚参数等）。
接着，Seata会创建一个UndoLog对象，并将生成的回滚日志信息填充到这个对象中。
最后，Seata会将UndoLog对象持久化到 undo log 日志表中。

具体到代码层面，回滚日志的构建和持久化可能涉及到DefaultResourceManager中的branchCommit和branchRollback方法，以及UndoLogManager中的undo_log表的操作。

由于Seata的源代码实在是太庞大和复杂，无法在这里提供详细的代码实现。但是，我可以提供一个概念性的代码示例来表示构建和持久化回滚日志的过程：




// 假设这是分支事务的提交方法
public void branchCommit(BranchSession branchSession) {
    // ... 业务SQL执行逻辑 ...
 
    if (业务SQL执行失败) {
        // 生成回滚日志
        UndoLog undoLog = buildUndoLog(branchSession);
 
        // 持久化回滚日志
        persistUndoLog(undoLog);
 
        // 回滚业务SQL
        rollback(undoLog);
 
        // 标记分支事务回滚
        branchSession.branchRollback();
    } else {
        // 标记分支事务提交
        branchSession.branchCommit();
    }
}
 
// 生成回滚日志
UndoLog buildUndoLog(BranchSession branchSession) {
    // 获取之前业务操作的数据
    // ...
 
    // 构建回滚日志对象
    UndoLog undoLog = new UndoLog();
    undoLog.setBranchId(branchSession.getBranchId());
    undoLog.setXid(branchSession.getXid());
    undoLog.setSqlUndoLog(生成回滚SQL);
    // ... 设置其他相关信息 ...
 
    return undoLog;
}
 
// 持久化回滚日志
void persistUndoLog(UndoLog undoLog) {
    // 将回滚日志写入undo log表
    // ...
}
 
// 回滚业务SQL
void rollback(UndoLog undoLog) {
    // 执行回滚SQL
    // ...
}

这个示例只是概念性的，并不是Seata实际的代码实现。实际的代码逻辑会更加复杂，包括对数据库操作的优化、异常处理等。

System

2024-08-13

所有,分布式

以下是在Debian 12系统上安装最新版MySQL NDB Cluster 8.0的步骤，这里我们使用了两个管理节点和两个数据节点的分布式部署方式。

更新系统并安装必要的软件包：




sudo apt update
sudo apt upgrade -y
sudo apt install -y openjdk-11-jdk

下载MySQL NDB Cluster 8.0的.deb安装包：




wget https://dev.mysql.com/get/Downloads/MySQL-NDB-Cluster-8.0/mysql-ndb-cluster-8.0-linux-glibc2.12-x86_64.deb

安装MySQL NDB Cluster：




sudo dpkg -i mysql-ndb-cluster-8.0-linux-glibc2.12-x86_64.deb

配置MySQL NDB Cluster。编辑/etc/mysql-ndb-cluster-data/config.ini文件，添加管理节点信息：




[ndbd default]
NoOfReplicas=1
 
[ndb_mgmd]
NodeId=1
HostName=127.0.0.1
DataDir=/var/lib/mysql-cluster
 
[ndbd]
NodeId=2
HostName=127.0.0.1
 
[ndbd]
NodeId=3
HostName=127.0.0.1
 
[mysqld]
NodeId=4
HostName=127.0.0.1

启动MySQL NDB Cluster管理节点：




sudo ndb_mgmd -f /etc/mysql-ndb-cluster-connector/config.ini --initial

启动MySQL NDB Cluster数据节点：




sudo ndbd

启动MySQL服务：




sudo systemctl start mysql-ndb-cluster-data

验证安装是否成功：




mysql -u root -p

以上步骤提供了在Debian 12上安装MySQL NDB Cluster 8.0的基本过程。在实际部署时，需要根据具体的网络环境和安全要求调整配置文件和防火墙规则。

- 阅读更多 -

zookeeper的环境搭建和配置

System

2024-08-13

所有,分布式

在搭建Zookeeper环境之前，请确保你的机器上安装了Java，因为Zookeeper是用Java编写的。

以下是搭建Zookeeper环境的基本步骤：

下载Zookeeper：
访问官方网站 https://zookeeper.apache.org/ 下载最新稳定版本的Zookeeper。
解压Zookeeper压缩包：
```
tar -xzf zookeeper-x.y.z.tar.gz
```
创建配置文件 zoo.cfg：
进入Zookeeper解压目录，创建配置文件 zoo.cfg。
```
cp conf/zoo_sample.cfg conf/zoo.cfg
```
编辑 zoo.cfg 文件，设置dataDir路径，例如：
```
dataDir=/path/to/your/zookeeper/data
```
你还可以根据需要配置客户端连接端口等选项。
启动Zookeeper服务：
```
bin/zkServer.sh start
```
检查Zookeeper服务状态：
```
bin/zkServer.sh status
```

以上步骤会启动一个基本的Zookeeper服务器。如果你想要配置集群模式，需要在 zoo.cfg 中添加集群服务器的配置，并且在数据目录中创建myid文件，指定当前服务器的ID。

这是一个非常基础的Zookeeper环境搭建指南。具体细节，比如配置参数和集群配置，需要根据实际需求进行调整。

- 阅读更多 -