分类后端技术下的文章

2024-08-13

在分布式系统中，高并发问题通常涉及到锁的使用。以下是使用Redisson解决分布式下高并发问题的一个示例代码：




import org.redisson.Redisson;
import org.redisson.api.RRateLimiter;
import org.redisson.api.RedissonClient;
import org.redisson.config.Config;
 
public class RedissonRateLimiterExample {
 
    public static void main(String[] args) {
        // 1. 配置RedissonClient
        Config config = new Config();
        config.useSingleServer().setAddress("redis://127.0.0.1:6379");
        RedissonClient redisson = Redisson.create(config);
 
        // 2. 获取RRateLimiter对象
        RRateLimiter rateLimiter = redisson.getRateLimiter("myRateLimiter");
 
        try {
            // 3. 设置每秒不超过10个请求的速率
            rateLimiter.trySetRate(RateType.OVERALL, 10, 1, RateIntervalUnit.SECONDS);
 
            // 4. 尝试获取许可证，超时时间为10秒
            if (rateLimiter.tryAcquire(1, 10, TimeUnit.SECONDS)) {
                // 5. 如果成功获取许可证，执行业务逻辑
                System.out.println("获取到许可证，执行业务逻辑");
                // 业务逻辑代码...
            } else {
                // 6. 如果在指定时间内无法获取许可证，执行降级或限流策略
                System.out.println("无法获取许可证，执行降级或限流策略");
                // 降级或限流策略代码...
            }
        } finally {
            // 7. 关闭RedissonClient
            redisson.shutdown();
        }
    }
}

在这个示例中，我们首先配置了RedissonClient，然后通过RedissonClient获取了一个RRateLimiter对象。我们设置了一个名为"myRateLimiter"的速率限制器，允许每秒10个请求的通过率。在业务逻辑中，我们尝试获取一个许可证，如果在指定的时间内成功获取，则执行后续的业务逻辑；如果无法获取，则执行降级或限流策略。最后，在操作完成后关闭RedissonClient。这样可以有效控制分布式系统中的并发访问，保证系统的稳定性和性能。

- 阅读更多 -

Java分布式微服务1——注册中心（Eureka/Nacos）

System

2024-08-13

所有,分布式

在Java的微服务架构中，服务注册与发现是核心组件之一。Eureka和Nacos都是流行的服务注册中心。

以下是使用Eureka作为服务注册中心的基本步骤和示例代码：

添加Eureka依赖到你的pom.xml文件中：




<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-starter-netflix-eureka-server</artifactId>
</dependency>

在你的Spring Boot应用中，启用Eureka服务器：




import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.cloud.netflix.eureka.server.EnableEurekaServer;
 
@EnableEurekaServer
@SpringBootApplication
public class EurekaServerApplication {
    public static void main(String[] args) {
        SpringApplication.run(EurekaServerApplication.class, args);
    }
}

在application.properties或application.yml配置文件中配置Eureka服务器：




server:
  port: 8761
 
eureka:
  instance:
    hostname: localhost
  client:
    registerWithEureka: false
    fetchRegistry: false
    serviceUrl:
      defaultZone: http://${eureka.instance.hostname}:${server.port}/eureka/

以上是一个基本的Eureka服务注册中心的配置和启动示例。

Nacos的使用类似，只是依赖和配置会有所不同。

对于Nacos，步骤可能包括：

添加Nacos依赖到你的pom.xml文件中：




<dependency>
    <groupId>com.alibaba.cloud</groupId>
    <artifactId>spring-cloud-starter-alibaba-nacos-discovery</artifactId>
</dependency>

在application.properties或application.yml配置文件中配置Nacos服务器信息：




spring.cloud.nacos.discovery.server-addr=127.0.0.1:8848
spring.application.name=nacos-discovery-example

在Spring Boot应用中启用服务注册：




import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.cloud.client.discovery.EnableDiscoveryClient;
 
@EnableDiscoveryClient
@SpringBootApplication
public class NacosDiscoveryApplication {
    public static void main(String[] args) {
        SpringApplication.run(NacosDiscoveryApplication.class, args);
    }
}

以上是Nacos作为服务注册中心的基本使用方法。

System

2024-08-13

所有,分布式

在Kubernetes中，我们可以使用PersistentVolume (PV) 和 PersistentVolumeClaim (PVC) 来抽象存储资源。这样，Pod 就可以像请求内存和 CPU 资源一样请求存储资源。

以下是如何使用 NFS 创建一个 PersistentVolume 并通过 PersistentVolumeClaim 为 Deployment 提供存储的步骤：

步骤1：创建一个 NFS 服务器

首先，你需要一个 NFS 服务器。如果你已经有一个 NFS 服务器，请跳过这一步。如果没有，你可以在你的本地机器或云服务上设置一个。

步骤2：创建一个 PersistentVolume

创建一个 PersistentVolume 资源以代表 NFS 服务器上的一个导出目录。




apiVersion: v1
kind: PersistentVolume
metadata:
  name: nfs-pv
spec:
  capacity:
    storage: 1Gi
  accessModes:
    - ReadWriteOnce
  nfs:
    server: nfs-server-ip
    path: "/nfs/data"

步骤3：创建一个 PersistentVolumeClaim

接下来，创建一个 PersistentVolumeClaim 来请求存储。




apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: nfs-pvc
spec:
  accessModes:
    - ReadWriteOnce
  resources:
    requests:
      storage: 1Gi

步骤4：在 Deployment 中使用 PersistentVolumeClaim

最后，在 Deployment 定义中引用 PersistentVolumeClaim，以便 Pod 可以挂载所需的存储。




apiVersion: apps/v1
kind: Deployment
metadata:
  name: nfs-deployment
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nfs-app
  template:
    metadata:
      labels:
        app: nfs-app
    spec:
      containers:
        - name: nfs-container
          image: nginx
          ports:
            - containerPort: 80
          volumeMounts:
            - name: nfs-volume
              mountPath: "/usr/share/nginx/html"
      volumes:
        - name: nfs-volume
          persistentVolumeClaim:
            claimName: nfs-pvc

在这个 Deployment 定义中，我们创建了一个名为 nfs-volume 的 volume，它引用了我们之前创建的 PersistentVolumeClaim nfs-pvc。这样，每个 Pod 都会挂载 NFS 导出目录到它的容器内部的 /usr/share/nginx/html 路径。

- 阅读更多 -

基于内存的分布式NoSQL数据库Redis介绍与安装_nosql 允许数据丢失

System

2024-08-13

所有,分布式




# 安装Redis
 
```bash
# 使用包管理器安装Redis
# 对于Ubuntu/Debian系统
sudo apt-get update
sudo apt-get install redis-server
 
# 对于CentOS系统
sudo yum install epel-release
sudo yum update
sudo yum install redis
 
# 启动Redis服务
redis-server
 
# 检查Redis是否正在运行
redis-cli ping




# 使用Python连接并操作Redis
import redis
 
# 连接到本地Redis实例
r = redis.Redis(host='localhost', port=6379, db=0)
 
# 设置键值对
r.set('key', 'value')
 
# 获取键对应的值
value = r.get('key')
print(value)  # 输出 b'value'，这是二进制格式的字符串
 
# 关闭连接
r.close()

这段代码展示了如何在Ubuntu/Debian或CentOS系统上安装Redis，并使用Python连接和操作Redis数据库。

- 阅读更多 -

Spring Cloud Sleuth：分布式链路跟踪

System

2024-08-13

所有,分布式

Spring Cloud Sleuth 提供了一种简单的方式来添加分布式跟踪到您的 Spring Cloud 应用程序。它将自动的为出入应用的每一个请求生成唯一的跟踪信息，比如 trace id 和 span id。

以下是一个简单的例子，展示如何在 Spring Cloud 应用中使用 Spring Cloud Sleuth 添加分布式跟踪。

首先，在您的 Spring Cloud 应用的 pom.xml 文件中添加依赖：




<dependencies>
    <dependency>
        <groupId>org.springframework.cloud</groupId>
        <artifactId>spring-cloud-starter-sleuth</artifactId>
    </dependency>
    <!-- 其他依赖 -->
</dependencies>

在您的应用的主类或者配置类中，添加 @EnableTraceing 注解启用跟踪：




import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.cloud.sleuth.annotation.EnableTraceing;
 
@EnableTraceing
@SpringBootApplication
public class MyApplication {
 
    public static void main(String[] args) {
        SpringApplication.run(MyApplication.class, args);
    }
}

启动您的应用程序，并开始进行一些请求。您将会在日志中看到类似以下的输出：




[timestamp] [traceId] [spanId] [exportable] [serviceName] [spanName] [spanKind] Timestamp: 2021-03-25 12:34:56, Trace ID: 6f8a642d75824a39820f59ef6d689c69, Span ID: 6f8a642d75824a398, Exportable: false, Service Name: my-service, Span Name: /api/endpoint, Span Kind: server

Spring Cloud Sleuth 会自动地为您处理这些跟踪信息，您只需要在代码中添加日志记录，就可以获取这些跟踪信息。

注意：Spring Cloud Sleuth 默认集成了 Zipkin 和 Brave，用于跟踪信息的收集和传输。如果您需要将跟踪信息发送到其他的系统，比如 Jaeger，您可能需要配置相应的发送器。

- 阅读更多 -

HDFS：大数据时代的分布式文件存储解决方案

System

2024-08-13

所有,分布式

HDFS（Hadoop Distributed File System）是Apache Hadoop项目的一个关键部分，它提供了一个分布式文件系统，用于存储非常大的数据集。HDFS解决了数据的存储和管理问题，使得用户可以在普通的硬件上存储和管理大量的数据。

以下是一个简单的Python代码示例，展示如何使用Hadoop Streaming来运行一个简单的MapReduce任务：




# mapper.py
import sys
for line in sys.stdin:
    words = line.split()
    for word in words:
        print('%s\t%s' % (word, 1))
 
# reducer.py
from operator import itemgetter
import sys
 
current_word = None
current_count = 0
word_counts = []
 
for line in sys.stdin:
    word, count = line.split('\t', 1)
    count = int(count)
    
    if current_word == word:
        current_count += count
    else:
        if current_word:
            word_counts.append((current_word, current_count))
        current_word = word
        current_count = count
 
if current_word:
    word_counts.append((current_word, current_count))
 
for word, count in sorted(word_counts, key=itemgetter(0)):
    print('%s\t%s' % (word, count))

在Hadoop上运行这个MapReduce任务，你需要先准备输入文件，然后使用Hadoop Streaming命令来提交任务：




HADOOP_HOME=/path/to/hadoop # 设置Hadoop安装目录
INPUT_PATH=/hdfs/input/path # 输入文件的HDFS路径
OUTPUT_PATH=/hdfs/output/path # 输出文件的HDFS路径
 
hadoop jar $HADOOP_HOME/share/hadoop/tools/lib/hadoop-streaming-*.jar \
-files mapper.py,reducer.py \
-mapper "python mapper.py" \
-reducer "python reducer.py" \
-input $INPUT_PATH \
-output $OUTPUT_PATH

这个例子展示了如何使用Python编写MapReduce任务的mapper和reducer，并展示了如何在Hadoop上运行这些任务。这是大数据处理的一个基本模式，对于学习Hadoop和MapReduce编程非常有帮助。

- 阅读更多 -

MySQL篇——详细分库分表原理，深入解读分库分表时机、策略以及生产解决方案！

System

2024-08-13

所有,mysql

分库分表是一种数据库设计策略，用于处理大量数据和高并发场景下的数据存储和检索问题。

分库分表的策略通常包括：

水平分库：将数据按照某种规则分散到不同的数据库实例中。
水平分表：将一个表中的数据按照某种规则分散到多个表中。
垂直分库：将不同业务模块的数据存储在不同的数据库中。
垂直分表：将一个表中的列按照业务关联性分散到不同的表中。

分库分表时机：

数据量大：当单表数据量达到千万级或亿级时考虑分库分表。
高并发：系统访问量大，数据库负载高时考虑。
扩展性需求：随着业务发展，需要数据库支持更多业务时。

分库分表策略：

哈希分库：通过某种哈希函数计算数据库分片键的哈希值，然后根据哈希值路由到对应的数据库。
范围分库：将数据库按照一定的范围划分，例如按时间分。
哈希分表：通过对分片键的哈希值进行取模运算，确定数据存储的具体表。
范围分表：将表按照一定的范围划分，例如按ID范围分。

生产解决方案：

ShardingSphere：开源的分库分表中间件，提供了数据分片、读写分离和分布式事务的功能。
MyCAT：由美团点评开源的分库分表中间件，具备高性能和高稳定性。
ProxySQL：一个高性能MySQL代理，支持分库分表和读写分离。

示例代码（ShardingSphere）：




// 配置分库分表规则
String createSchemaSQL = "SHOW CREATE DATABASE mydb";
Statement statement = connection.createStatement();
statement.execute(createSchemaSQL);
 
String createTableSQL = "CREATE TABLE mydb.mytable (...);";
statement.execute(createTableSQL);
 
// 使用ShardingSphere进行数据操作
String insertSQL = "INSERT INTO mydb.mytable (id, name) VALUES (1, 'Alice');";
PreparedStatement preparedStatement = connection.prepareStatement(insertSQL);
preparedStatement.executeUpdate();

以上是分库分表的概念和常见策略，以及ShardingSphere作为一种分库分表中间件的简单示例。在实际应用中，还需要考虑数据库的选择、性能测试、监控等方面。

- 阅读更多 -

MySQL多表关联查询

System

2024-08-13

所有,mysql

在MySQL中，多表关联查询通常使用JOIN子句来完成。以下是一个简单的例子，假设我们有两个表：employees（员工表）和departments（部门表）。我们想要查询每个员工及其所在部门的名称。




SELECT employees.name AS employee_name, departments.name AS department_name
FROM employees
JOIN departments ON employees.department_id = departments.id;

这里使用了INNER JOIN来关联两个表，通过employees表中的department_id字段与departments表的id字段相匹配。查询结果将包含员工姓名和部门名称。

如果你需要更复杂的关联，比如左连接（LEFT JOIN）、右连接（RIGHT JOIN）或全外连接（FULL JOIN），只需要更改JOIN子句即可。

例如，如果你想查询所有员工，即使他们没有对应的部门信息，你可以这样写：




SELECT employees.name AS employee_name, departments.name AS department_name
FROM employees
LEFT JOIN departments ON employees.department_id = departments.id;

这里使用了LEFT JOIN来确保即使在departments表中没有匹配的行，employees表的所有行也会被选择。

- 阅读更多 -

DataX3.0在linux下配置同步oracle至mysql并部署可视化工具

System

2024-08-13

所有,mysql

在Linux环境下配置DataX3.0进行Oracle到MySQL的数据同步，并部署可视化工具，你需要完成以下步骤：

安装DataX：
- 从阿里巴巴开源软件镜像站点下载DataX：http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz
- 解压缩到指定目录
- 确保Java环境已安装并配置好环境变量
配置DataX job：
- 在{DataX_home}/job/目录下创建一个新的job配置文件，例如oracle2mysql.json
- 编辑该配置文件，配置Oracle数据源、MySQL数据源以及需要同步的表和字段

运行DataX job：

在命令行中执行DataX命令，如下所示：




python {DataX_home}/bin/datax.py {DataX_home}/job/oracle2mysql.json

部署DataX可视化工具（可选）：
- 根据DataX官方文档指引部署DataX-Web
- 配置DataX-Web与DataX集成
- 通过Web界面进行作业配置和运行

以下是一个简单的oracle2mysql.json配置文件示例：




{
    "job": {
        "setting": {
            "speed": {
                "channel": 1
            }
        },
        "content": [
            {
                "reader": {
                    "name": "oraclereader",
                    "parameter": {
                        "username": "your_oracle_username",
                        "password": "your_oracle_password",
                        "column": ["id", "name", "age"],
                        "splitPk": "id",
                        "connection": [
                            {
                                "querySql": [
                                    "select id, name, age from your_oracle_table"
                                ],
                                "jdbcUrl": [
                                    "jdbc:oracle:thin:@//host:port/SID"
                                ]
                            }
                        ]
                    }
                },
                "writer": {
                    "name": "mysqlwriter",
                    "parameter": {
                        "username": "your_mysql_username",
                        "password": "your_mysql_password",
                        "writeMode": "insert",
                        "column": ["id", "name", "age"],
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:mysql://your_mysql_host:port/your_mysql_database",
                                "table": ["your_mysql_table"]
                            }
                        ]
                    }
                }
            }
        ]
    }
}

请根据你的实际数据库配置信息（如主机名、端口、SID、数据库用户名和密码等）以及需要同步的表和字段进行相应的修改。

注意：确保Oracle JDBC驱动（如ojdbc6.jar或ojdbc8.jar）已添加到DataX的lib目录下，并且MySQL的JDBC驱动（如m

- 阅读更多 -

MySQL 之索引（简单版）

System

2024-08-13

所有,mysql

在MySQL中，索引是一种帮助数据库高效获取数据的数据结构。索引可以提高查询速度，但也会降低插入、删除和更新的速度，因为在维护索引的数据结构时需要更多的时间。

MySQL中常见的索引类型有：

普通索引：最基本的索引类型，没有唯一性的限制。
唯一索引：与普通索引类似，但区别在于唯一索引的列不允许有重复值。
主键索引：特殊的唯一索引，用于唯一标识表中的每一行，不允许有 NULL 值，一个表中只能有一个主键。
组合索引：由多个列组合而成，用于组合索引的多个列同时出现在查询条件中时，可以触发组合索引。
全文索引：用于全文搜索，仅MyISAM和InnoDB引擎支持。

创建索引的SQL语法：




-- 创建普通索引
CREATE INDEX index_name ON table_name(column_name);
 
-- 创建唯一索引
CREATE UNIQUE INDEX index_name ON table_name(column_name);
 
-- 创建主键索引
ALTER TABLE table_name ADD PRIMARY KEY (column_name);
 
-- 创建组合索引
CREATE INDEX index_name ON table_name(column1_name, column2_name);
 
-- 创建全文索引
CREATE FULLTEXT INDEX index_name ON table_name(column_name);

查看索引的SQL语法：




-- 查看表中的索引
SHOW INDEX FROM table_name;

删除索引的SQL语法：




-- 删除索引
DROP INDEX index_name ON table_name;

请注意，索引的创建和删除可能会影响数据库性能，应在了解当前数据库性能需求和索引对数据操作的影响后谨慎使用。

- 阅读更多 -