Tech Blog

2024-08-16

在Kafka中，如果你想要手动提交消费者的offset，你需要在消费者的配置中设置enable.auto.commit为false，这样消费者就不会自动提交offset了。然后，你可以在消费消息之后，确保消息处理成功后，手动调用commitSync()方法来提交offset。

以下是一个Java代码示例，展示了如何在Kafka中手动提交消费者的offset：




import org.apache.kafka.clients.consumer.KafkaConsumer;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.consumer.ConsumerConfig;
 
import java.util.Arrays;
import java.util.Properties;
 
public class ManualCommitConsumer {
    public static void main(String[] args) {
        Properties props = new Properties();
        props.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, "localhost:9092");
        props.put(ConsumerConfig.GROUP_ID_CONFIG, "test");
        props.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, "false");
        props.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, "org.apache.kafka.common.serialization.StringDeserializer");
        props.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, "org.apache.kafka.common.serialization.StringDeserializer");
 
        KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);
        consumer.subscribe(Arrays.asList("topic"));
 
        while (true) {
            ConsumerRecords<String, String> records = consumer.poll(100);
            for (ConsumerRecord<String, String> record : records) {
                // 处理消息
                System.out.println(record.value());
            }
            // 提交offset
            consumer.commitSync();
        }
    }
}

在这个例子中，我们创建了一个Kafka消费者，并通过props设置了不自动提交offset。然后，在一个无限循环中，我们轮询消费消息，处理完毕后，通过调用commitSync()方法手动同步提交了offset。如果处理消息时发生异常，你可以在异常处理逻辑中调用consumer.commitAsync()来异步提交offset，或者在异常发生时采取适当的措施，如重试或将消息转发到错误处理主题。

- 阅读更多 -

Linux 服务查询命令（包括服务器、cpu、数据库、中间件）

System

2024-08-16

所有,中间件

在Linux中，查询服务器信息、CPU使用情况、数据库和中间件状态的命令如下：

服务器信息查询：
- 查看服务器名称：hostname
- 查看服务器IP地址：ip addr
- 查看系统信息：uname -a
- 查看操作系统版本：cat /etc/*release
CPU使用情况查询：
- 查看CPU使用率：top 或 htop
- 查看CPU核心数：lscpu
数据库状态查询（以MySQL为例）：
- 查看MySQL服务状态：sudo systemctl status mysql
- 查看MySQL版本：mysql --version 或登录MySQL后使用 SELECT VERSION();
中间件状态查询（以Nginx为例）：
- 查看Nginx服务状态：sudo systemctl status nginx
- 查看Nginx版本：nginx -v 或访问Nginx状态页面（如果配置了的话）

请根据你的具体需求和安装的服务来选择相应的命令。这些命令提供了基本的系统和服务信息，更复杂的监控和管理可以通过安装和使用更高级的工具来实现，例如：htop, iotop, nmon, smem, glances 等。

- 阅读更多 -

Nestjs实战干货-概况-中间件-Middleware

System

2024-08-16

所有,中间件

在NestJS中，中间件是一种组织应用程序逻辑的方式，它可以拦截进入的请求和传出的响应。

以下是一个简单的NestJS中间件示例，它会记录每个请求的路径，并可以对请求进行预处理或后处理：




import { Injectable, NestMiddleware } from '@nestjs/common';
import { Request, Response, NextFunction } from 'express';
 
@Injectable()
export class LoggerMiddleware implements NestMiddleware {
  use(req: Request, res: Response, next: NextFunction) {
    console.log(`Request path: ${req.path}`);
    // 可以在这里进行请求的预处理
    // ...
 
    // 继续执行下一个中间件或路由处理程序
    next();
 
    // 可以在这里处理响应的后处理
    // ...
  }
}

然后，你需要将这个中间件应用到你的模块或控制器中：




import { Module, NestModule, MiddlewareConsumer } from '@nestjs/common';
import { LoggerMiddleware } from './logger.middleware';
 
@Module({
  // ... (controllers and providers)
})
export class AppModule implements NestModule {
  configure(consumer: MiddlewareConsumer) {
    consumer
      .apply(LoggerMiddleware)
      .forRoutes('*'); // 这里可以指定具体的路由或控制器
      // .exclude(...); // 可以排除某些路由
  }
}

在这个例子中，LoggerMiddleware会被应用到所有路由上。你可以根据需要自定义中间件的功能，并且可以使用consumer对象来决定中间件应该应用于哪些路由以及排除哪些路由。

- 阅读更多 -

rocketMq消息队列详细使用与实践整合spring

System

2024-08-16

所有,中间件

RocketMQ是一个分布式消息中间件，可以用于发送和接收消息。以下是一个使用RocketMQ的简单示例，展示如何在Spring项目中配置和使用RocketMQ。

在Spring项目中添加RocketMQ依赖，比如使用Maven:




<dependency>
    <groupId>org.apache.rocketmq</groupId>
    <artifactId>rocketmq-client</artifactId>
    <version>4.9.0</version>
</dependency>

在Spring配置文件中配置RocketMQ的Producer和Consumer:




@Configuration
public class RocketMQConfig {
 
    @Value("${rocketmq.namesrvAddr}")
    private String namesrvAddr;
 
    @Value("${rocketmq.producer.group}")
    private String producerGroup;
 
    @Value("${rocketmq.consumer.group}")
    private String consumerGroup;
 
    @Bean(initMethod = "start", destroyMethod = "shutdown")
    public DefaultMQProducer producer() {
        DefaultMQProducer producer = new DefaultMQProducer(producerGroup);
        producer.setNamesrvAddr(namesrvAddr);
        producer.start();
        return producer;
    }
 
    @Bean(initMethod = "start", destroyMethod = "shutdown")
    public DefaultMQPushConsumer consumer() {
        DefaultMQPushConsumer consumer = new DefaultMQPushConsumer(consumerGroup);
        consumer.setNamesrvAddr(namesrvAddr);
        consumer.subscribe("TopicTest", "*");
        consumer.registerMessageListener((MessageListenerConcurrently) (msgs, context) -> {
            for (MessageExt msg : msgs) {
                System.out.println(new String(msg.getBody()));
            }
            return ConsumeConcurrentlyStatus.CONSUME_SUCCESS;
        });
        consumer.start();
        return consumer;
    }
}

使用Producer发送消息:




@Autowired
private DefaultMQProducer producer;
 
public void sendMessage(String topic, String tags, String message) throws Exception {
    Message msg = new Message(topic, tags, message.getBytes(RemotingHelper.DEFAULT_CHARSET));
    SendResult sendResult = producer.send(msg);
    System.out.println(sendResult);
}

使用Consumer接收消息。

以上代码展示了如何在Spring项目中配置和启动RocketMQ的Producer和Consumer。Producer用于发送消息，Consumer用于接收并处理消息。

注意：在实际应用中，你需要根据自己的RocketMQ服务器地址、生产者和消费者的组名以及主题（Topic）等配置信息来调整配置。同时，消息的发送和接收应该根据实际业务逻辑来进行异常处理和资源管理。

System

2024-08-16

所有,中间件

报错解释：

com.alibaba.nacos.api.exception.NacosException: Request nacos server failed: 表示尝试请求 Nacos 服务器时失败了。Nacos 是一个服务发现和配置管理平台，它提供了服务注册、服务发现等功能。这个错误通常意味着客户端无法与 Nacos 服务器建立连接或执行请求。

可能原因：

网络问题：客户端与服务器之间的网络连接可能存在问题。
Nacos 服务器不可用：Nacos 服务器可能没有运行，或者不在预期的主机和端口上。
配置错误：客户端配置的服务器地址或端口可能不正确。
防火墙或安全组设置：防火墙或安全组规则可能阻止了客户端与服务器的通信。
Nacos 服务器负载过高：服务器可能由于负载过重而无法处理请求。

解决方法：

检查网络连接，确保客户端能够访问 Nacos 服务器。
确认 Nacos 服务器正在运行，并且监听正确的主机和端口。
核对客户端配置，确保服务器地址和端口设置正确无误。
检查防火墙和安全组规则，确保客户端能够访问 Nacos 服务器所在的端口。
查看 Nacos 服务器的日志和监控指标，如果服务器负载过高，考虑扩容或优化。

在解决问题时，可以从最基础的网络连接检查开始，逐步排除可能的原因，直至找到问题根源并解决。

System

2024-08-16

所有,nodejs




// 引入必要的模块
const ffi = require('ffi-napi');
const ref = require('ref-napi');
 
// 定义C数据类型
const intType = ref.types.int;
const doubleType = ref.types.double;
 
// 声明要调用的C函数
const myLibrary = ffi.Library('mylib', {
  'my_function': [ intType, [ doubleType ] ]
});
 
// 调用C函数
const result = myLibrary.my_function(5.0);
 
// 输出结果
console.log(result);

这段代码展示了如何使用ffi-napi和ref-napi来定义和调用一个假设的C函数my_function，它接受一个double类型的参数并返回一个int类型的结果。在实际应用中，mylib应该替换为实际包含该函数的C库的名称。这是一个Node.js中调用C函数的简单例子，展示了如何将C语言的功能集成到Node.js环境中。

- 阅读更多 -

scrapy暂停与重启/数据收集/去重原理/爬虫中间件等

System

2024-08-16

所有,中间件

Scrapy 提供了多种方式来控制爬虫的暂停和重启，包括信号、设置标志位，或者直接使用命令行工具。

使用命令行暂停和重启：




# 启动爬虫
scrapy crawl myspider
 
# 在另外一个终端，发送信号暂停爬虫
kill -SIGSTOP $(pgrep -f 'scrapy crawl myspider')
 
# 暂停后，重新启动爬虫
kill -SIGCONT $(pgrep -f 'scrapy crawl myspider')

使用Scrapy内置信号控制：




from twisted.internet import reactor
from scrapy.crawler import CrawlerRunner
from scrapy.utils.project import get_project_settings
from myspider.spiders.myspider import MySpider
 
runner = CrawlerRunner(get_project_settings())
 
def start_crawler():
    return runner.crawl(MySpider)
 
def stop_crawler():
    reactor.stop()
 
# 启动爬虫
d = start_crawler()
d.addBoth(lambda _: stop_crawler())
 
# 运行Twisted reactor
reactor.run()

数据收集、去重和爬虫中间件是Scrapy的核心组件，用于处理爬取的数据，确保爬虫行为的灵活性和效率。

数据收集：




# 在爬虫中
def parse(self, response):
    item = {}
    item['name'] = response.css('div.name::text').extract_first()
    item['link'] = response.urljoin(response.css('div.link::attr(href)').extract_first())
    yield item

去重：Scrapy内置了去重系统，通过指定item的key作为去重的依据。




class MySpider(scrapy.Spider):
    # ...
    def start_requests(self):
        urls = ['http://example.com/1', 'http://example.com/2']
        for url in urls:
            yield scrapy.Request(url=url, callback=self.parse_item, dont_filter=False)

爬虫中间件：




# 在middlewares.py中
class MyCustomMiddleware(object):
    def process_request(self, request):
        # 可以在这里添加自定义逻辑，比如代理切换
        pass
 
    def process_response(self, request, response):
        # 可以在这里处理响应，或者重新发起请求
        pass

在settings.py中启用中间件：




DOWNLOADER_MIDDLEWARES = {
    'myspider.middlewares.MyCustomMiddleware': 543,
}

这些是Scrapy中控制爬虫行为和实现数据收集、去重和爬虫中间件的基本方法。

System

2024-08-16

所有,中间件

在MySQL中，广播表（Broadcast Table）和绑定表（Federated Table）是两种特殊类型的表，它们用于访问远程服务器上的表。

广播表：

广播表用于将一条查询的结果分发到集群中的所有节点。
它们通常用于数据仓库或报告系统，不支持DML操作。

绑定表：

绑定表用于链接远程MySQL服务器上的表。
它们允许你像操作本地表一样操作远程表。

以下是创建广播表和绑定表的示例SQL语句：




-- 创建广播表
CREATE TABLE broadcast_table_name (...) ENGINE=NDB;
 
-- 创建绑定表
CREATE TABLE federated_table_name (...) 
ENGINE=FEDERATED 
CONNECTION='mysql://[username]:[password]@[host]:[port]/[database]/[table_name]';

在实际应用中，你可能需要在水平分库的基础上，对每个分库的数据进行分表。以下是一个简化的例子：




-- 假设我们已经水平分库，每个库有自己的表后缀，如db0, db1...
-- 创建分表
CREATE TABLE db0.user_0 (id INT PRIMARY KEY, ...) ENGINE=InnoDB;
CREATE TABLE db1.user_1 (id INT PRIMARY KEY, ...) ENGINE=InnoDB;
 
-- 查询操作，需要合并多个分表查询结果
SELECT * FROM db0.user_0 WHERE id = 10 UNION ALL SELECT * FROM db1.user_1 WHERE id = 10;
 
-- 删除操作，需要分别在各分表执行删除
DELETE FROM db0.user_0 WHERE id = 10;
DELETE FROM db1.user_1 WHERE id = 10;

在实际应用中，你可能需要使用分库分表中间件来简化这些操作，如ShardingSphere、MyCAT等。这些中间件提供了数据分片和读写分离的功能，能够更好地管理数据库的水平和垂直扩展。

- 阅读更多 -

postgresql分库分表中间件开源实现方案

System

2024-08-16

所有,中间件

PostgreSQL 分库分表间件可以使用开源项目 pg_partman 来实现。以下是如何使用 pg_partman 进行分库分表的简要步骤：

安装 pg_partman 插件。
配置 postgresql.conf 和 pg_hba.conf 文件以允许使用该插件。
创建分区表。

以下是一个简单的例子：




-- 安装 pg_partman
CREATE EXTENSION pg_partman;
 
-- 配置 postgresql.conf 和 pg_hba.conf
-- 在这里添加对 pg_partman 的支持配置
 
-- 创建一个范围分区的表
CREATE TABLE measurement (
    city_id         int not null,
    logdate         date not null,
    peaktemp        int,
    unitsales       int
) PARTITION BY RANGE (logdate);
 
-- 为分区创建模板
CREATE TABLE measurement_y2020 PARTITION OF measurement FOR VALUES FROM ('2020-01-01') TO ('2021-01-01');
CREATE TABLE measurement_y2021 PARTITION OF measurement FOR VALUES FROM ('2021-01-01') TO ('2022-01-01');
CREATE TABLE measurement_y2022 PARTITION OF measurement FOR VALUES FROM ('2022-01-01') TO ('2023-01-01');
-- 重复上述步骤为每一年创建分区
 
-- 现在可以像普通表一样插入和查询 measurement 表，
-- 插入的数据会根据 logdate 自动分配到正确的分区。
INSERT INTO measurement (city_id, logdate, peaktemp, unitsales) VALUES (1, '2021-05-15', 22, 100);

在实际应用中，你可能需要根据实际需求来调整分区类型（范围、列表、哈希）和分区策略。pg_partman 支持更多高级功能，如分区维护、备份和恢复等。

- 阅读更多 -

【Java程序员面试专栏分布式中间件】ElasticSearch 核心面试指引

System

2024-08-16

所有,中间件

在ElasticSearch中，你可能会被问到以下几个方面的问题：

集群健康状态
索引管理
分析查询性能
数据迁移和恢复
安全配置

以下是针对这些问题的简要解答和示例代码：

集群健康状态:




// 使用Elasticsearch RestClient
RestClient client = RestClient.builder(new HttpHost("localhost", 9200, "http")).build();
 
HttpGet request = new HttpGet("/_cluster/health");
Response response = client.performRequest(request);
String healthStatus = EntityUtils.toString(response.getEntity());
 
System.out.println(healthStatus);

索引管理:




// 创建索引
HttpPut createIndexRequest = new HttpPut("/my_index");
Response response = client.performRequest(createIndexRequest);
 
// 删除索引
HttpDelete deleteIndexRequest = new HttpDelete("/my_index");
Response response = client.performRequest(deleteIndexRequest);

分析查询性能:




// 使用Elasticsearch SQL功能分析查询
HttpPost explainRequest = new HttpPost("/_sql?format=txt");
explainRequest.setHeader("Content-Type", "application/json");
String jsonBody = "{\"query\": \"SELECT * FROM my_index LIMIT 10\"}";
StringEntity entity = new StringEntity(jsonBody);
explainRequest.setEntity(entity);
 
Response response = client.performRequest(explainRequest);
String explainResult = EntityUtils.toString(response.getEntity());
 
System.out.println(explainResult);

数据迁移和恢复:




// 使用Elasticsearch Repository进行数据迁移
RestHighLevelClient client = new RestHighLevelClient(...);
 
GetSourceRequest getSourceRequest = new GetSourceRequest();
getSourceRequest.index("my_index");
getSourceRequest.id("my_id");
 
GetSourceResponse response = client.getSource(getSourceRequest, RequestOptions.DEFAULT);
 
Map<String, Object> source = response.getSource();
// 处理source数据，例如转存到另一个Elasticsearch集群

安全配置:




// 设置Elasticsearch节点的安全性
RestClientBuilder builder = RestClient.builder(new HttpHost("localhost", 9200, "http"))
        .setHttpClientConfigCallback(new RestClientBuilder.HttpClientConfigCallback() {
            @Override
            public HttpAsyncClientBuilder customizeHttpClient(HttpAsyncClientBuilder httpClientBuilder) {
                return httpClientBuilder.setDefaultCredentialsProvider(new BasicCredentialsProvider());
            }
        });
 
RestClient client = build

- 阅读更多 -