处理类描述中的TODO

实现敏感词校验功能（基于redis交集操作以及dfa敏感词树两种方式实现）
18 changed files with 284 additions and 16 deletions
--- a/beacon-api/src/main/java/com/mashibing/api/service/SmsService.java
+++ b/beacon-api/src/main/java/com/mashibing/api/service/SmsService.java
@ -5,7 +5,7 @@ import javax.servlet.http.HttpServletRequest;
 /**
 * @author heqijun
 * @ClassName: SmsService
- * @Description: TODO(这里用一句话描述这个类的作用)
+ * @Description: SmsService接口
 * @date 2025/6/5 16:56
 */

--- a/beacon-api/src/main/java/com/mashibing/api/service/impl/SmsServiceImpl.java
+++ b/beacon-api/src/main/java/com/mashibing/api/service/impl/SmsServiceImpl.java
@ -12,7 +12,7 @@ import javax.servlet.http.HttpServletRequest;
 /**
 * @author heqijun
 * @ClassName: SmsServiceImpl
- * @Description: TODO(这里用一句话描述这个类的作用)
+ * @Description: SmsServiceImpl接口实现类
 * @date 2025/6/5 16:57
 */

--- a/beacon-api/src/main/java/com/mashibing/api/service/sendCheck/SendCheckContext.java
+++ b/beacon-api/src/main/java/com/mashibing/api/service/sendCheck/SendCheckContext.java
@ -11,7 +11,7 @@ import java.util.Map;
 /**
 * @author heqijun
 * @ClassName: SendCheckContext
- * @Description: TODO(这里用一句话描述这个类的作用)
+ * @Description: 短信发送入口侧校验上下文
 * @date 2025/6/4 20:19
 */

--- a/beacon-cache/src/main/java/com/mashibing/cache/controller/CacheController.java
+++ b/beacon-cache/src/main/java/com/mashibing/cache/controller/CacheController.java
@ -12,7 +12,7 @@ import java.util.Set;
 /**
 * @author heqijun
 * @ClassName: CacheController
- * @Description: TODO(这里用一句话描述这个类的作用)
+ * @Description: 缓存模块CacheController接口
 * @date 2025/6/5 13:46
 */

@ -76,6 +76,21 @@ public class CacheController {
 		redisClient.sAdd(key, value);
 	}

+	@PostMapping("/sinterstr/{key}/{sinterkey}")
+	public Set<Object> sinterStr(@PathVariable(value = "key") String key, @PathVariable String sinterkey, @RequestBody String... value) {
+		log.info("【缓存模块】sinterStr: key = {}，sinterkey={}，\nvalue = {}", key, sinterkey, value);
+		//1. 存入key和value
+		redisClient.sAdd(key, value);
+		//2. 取交集
+		Set<Object> result = redisClient.sIntersect(key, sinterkey);
+		if (result != null && !result.isEmpty()) {
+			log.info("【缓存模块】sinterStr: 交集={}", result);
+		}
+		//3. 删除key
+		redisClient.delete(key);
+		return result;
+	}
+
 	@PostMapping("/smember/{key}")
 	public Set smember(@PathVariable(value = "key") String key) {
 		log.info("【缓存模块】smember: key = {}，", key);
--- a/beacon-common/src/main/java/com/mashibing/common/annotation/Description.java
+++ b/beacon-common/src/main/java/com/mashibing/common/annotation/Description.java
@ -8,7 +8,7 @@ import java.lang.annotation.Target;
 /**
 * @author heqijun
 * @ClassName: Description
- * @Description: TODO(这里用一句话描述这个类的作用)
+ * @Description: 用于描述字段的含义
 * @date 2025/6/4 20:42
 */

--- a/beacon-common/src/main/java/com/mashibing/common/annotation/validParam/NotNull.java
+++ b/beacon-common/src/main/java/com/mashibing/common/annotation/validParam/NotNull.java
@ -3,7 +3,7 @@ package com.mashibing.common.annotation.validParam;
 /**
 * @author heqijun
 * @ClassName: NotNull
- * @Description: TODO(这里用一句话描述这个类的作用)
+ * @Description: 自定义@NotNull注解（未实现）
 * @date 2025/6/5 11:46
 */

--- a/beacon-common/src/main/java/com/mashibing/common/clients/BeaconCacheClient.java
+++ b/beacon-common/src/main/java/com/mashibing/common/clients/BeaconCacheClient.java
@ -42,6 +42,9 @@ public interface BeaconCacheClient {
 	@PostMapping("cache/saddstr/{key}")
 	void saddStr(@PathVariable(value = "key") String key, @RequestBody String... value);

+	@PostMapping("cache/sinterstr/{key}/{sinterkey}")
+	Set<Object> sinterStr(@PathVariable(value = "key") String key, @PathVariable String sinterkey, @RequestBody String... value);
+
 	@PostMapping("cache/smember/{key}")
 	Set smember(@PathVariable(value = "key") String key);

--- a/beacon-common/src/main/java/com/mashibing/common/enums/JsonResultCode.java
+++ b/beacon-common/src/main/java/com/mashibing/common/enums/JsonResultCode.java
@ -5,7 +5,7 @@ import lombok.*;
 /**
 * @author heqijun
 * @ClassName: JsonResultCodeEnum
- * @Description: TODO(这里用一句话描述这个类的作用)
+ * @Description: JsonResultCode枚举
 * @date 2025/6/5 11:57
 */

--- a/beacon-strategy/pom.xml
+++ b/beacon-strategy/pom.xml
@ -48,6 +48,13 @@
            <groupId>org.projectlombok</groupId>
            <artifactId>lombok</artifactId>
        </dependency>
+        <!-- ik分词器 -->
+        <dependency>
+            <groupId>com.janeluo</groupId>
+            <artifactId>ikanalyzer</artifactId>
+            <version>2012_u6</version>
+        </dependency>
+
        <!-- common公共组件 -->
        <dependency>
            <groupId>com.mashibing</groupId>
--- a/beacon-strategy/src/main/java/com/mashibing/strategy/StrategyApplication.java
+++ b/beacon-strategy/src/main/java/com/mashibing/strategy/StrategyApplication.java
@ -7,16 +7,16 @@ import org.springframework.cloud.openfeign.EnableFeignClients;

 /**
 * @author heqijun
- * @ClassName: StragyApplication
- * @Description: TODO(这里用一句话描述这个类的作用)
+ * @ClassName: StrategyApplication
+ * @Description: StrategyApplication策略模块启动类
 * @date 2025/6/7 19:03
 */

@SpringBootApplication
@EnableFeignClients
@EnableDiscoveryClient
-public class StragyApplication {
+public class StrategyApplication {
 	public static void main(String[] args) {
-		SpringApplication.run(StragyApplication.class, args);
+		SpringApplication.run(StrategyApplication.class, args);
 	}
 }
--- a/beacon-strategy/src/main/java/com/mashibing/strategy/config/RestTemplateConfig.java
+++ b/beacon-strategy/src/main/java/com/mashibing/strategy/config/RestTemplateConfig.java
@ -7,7 +7,7 @@ import org.springframework.web.client.RestTemplate;
 /**
 * @author heqijun
 * @ClassName: RestTemplateConfig
- * @Description: TODO(这里用一句话描述这个类的作用)
+ * @Description: RestTemplateConfig
 * @date 2025/6/8 16:33
 */

--- a/beacon-strategy/src/main/java/com/mashibing/strategy/mq/PreSendListener.java
+++ b/beacon-strategy/src/main/java/com/mashibing/strategy/mq/PreSendListener.java
@ -15,7 +15,7 @@ import java.io.IOException;
 /**
 * @author heqijun
 * @ClassName: PreSendListener
- * @Description: TODO(这里用一句话描述这个类的作用)
+ * @Description: 策略模块配置监听接口模块消息的队列
 * @date 2025/6/7 19:36
 */

--- a/beacon-strategy/src/main/java/com/mashibing/strategy/pojo/PhasePojo.java
+++ b/beacon-strategy/src/main/java/com/mashibing/strategy/pojo/PhasePojo.java
@ -6,7 +6,7 @@ import lombok.Data;
 /**
 * @author heqijun
 * @ClassName: PhasePOJO
- * @Description: TODO(这里用一句话描述这个类的作用)
+ * @Description: 号段补全功能pojo
 * @date 2025/6/8 16:39
 */

--- a/beacon-strategy/src/main/java/com/mashibing/strategy/service/strategyfilter/impl/DFADirtyWordStrategyFilter.java
+++ b/beacon-strategy/src/main/java/com/mashibing/strategy/service/strategyfilter/impl/DFADirtyWordStrategyFilter.java
@ -0,0 +1,51 @@
+package com.mashibing.strategy.service.strategyfilter.impl;
+
+import com.mashibing.common.constant.CacheConstant;
+import com.mashibing.common.pojo.StandardSubmit;
+import com.mashibing.strategy.feignclient.CacheClient;
+import com.mashibing.strategy.service.strategyfilter.StrategyFilter;
+import com.mashibing.strategy.utils.DirtyWordTree;
+import lombok.extern.slf4j.Slf4j;
+import org.springframework.beans.factory.annotation.Autowired;
+import org.springframework.stereotype.Service;
+import org.wltea.analyzer.core.IKSegmenter;
+import org.wltea.analyzer.core.Lexeme;
+
+import java.io.IOException;
+import java.io.StringReader;
+import java.util.HashSet;
+import java.util.Set;
+
+/**
+ * @author heqijun
+ * @ClassName: DirtyWordStrategyFilter
+ * @Description: 敏感词校验
+ * @date 2025/6/7 20:26
+ */
+
+@Slf4j
+@Service(value = "dfaDirtyword")
+public class DFADirtyWordStrategyFilter implements StrategyFilter {
+
+	@Autowired
+	CacheClient cacheClient;
+
+	@Override
+	public void strategy(StandardSubmit submit) {
+		log.info("【策略模块-敏感词校验】开始====================================");
+		String text = submit.getText();
+		Set<String> set = new HashSet<>();
+		long start = System.currentTimeMillis();
+		long end = System.currentTimeMillis();
+
+		log.info("【策略模块-敏感词校验】通过敏感词树校验敏感词");
+		Set<String> result = DirtyWordTree.getDirtyWord(text);
+
+		if (!result.isEmpty()) {
+			log.error("【策略模块-敏感词校验】短信内容包含敏感词：{}", result);
+			return;
+//			throw new RuntimeException("短信内容包含敏感词");
+		}
+		log.info("【策略模块-敏感词校验】敏感词校验通过");
+	}
+}
--- a/beacon-strategy/src/main/java/com/mashibing/strategy/service/strategyfilter/impl/DirtyWordStrategyFilter.java
+++ b/beacon-strategy/src/main/java/com/mashibing/strategy/service/strategyfilter/impl/DirtyWordStrategyFilter.java
@ -1,9 +1,19 @@
 package com.mashibing.strategy.service.strategyfilter.impl;

+import com.mashibing.common.constant.CacheConstant;
 import com.mashibing.common.pojo.StandardSubmit;
+import com.mashibing.strategy.feignclient.CacheClient;
 import com.mashibing.strategy.service.strategyfilter.StrategyFilter;
 import lombok.extern.slf4j.Slf4j;
+import org.springframework.beans.factory.annotation.Autowired;
 import org.springframework.stereotype.Service;
+import org.wltea.analyzer.core.IKSegmenter;
+import org.wltea.analyzer.core.Lexeme;
+
+import java.io.IOException;
+import java.io.StringReader;
+import java.util.HashSet;
+import java.util.Set;

 /**
 * @author heqijun
@ -16,8 +26,41 @@ import org.springframework.stereotype.Service;
@Service(value = "dirtyword")
 public class DirtyWordStrategyFilter implements StrategyFilter {

+	@Autowired
+	CacheClient cacheClient;
+
 	@Override
-	public void strategy(StandardSubmit standardSubmit) {
-		log.info("【策略模块-敏感词校验】。。。");
+	public void strategy(StandardSubmit submit) {
+		log.info("【策略模块-敏感词校验】开始====================================");
+		Set<String> set = new HashSet<>();
+		long start = System.currentTimeMillis();
+		StringReader reader = new StringReader(submit.getText());
+		IKSegmenter ik = new IKSegmenter(reader, false);
+		long end = System.currentTimeMillis();
+		log.info("【策略模块-敏感词校验】分词器读取短信耗时：{}ms", end - start);
+		Lexeme lexeme = null;
+		start = System.currentTimeMillis();
+		while (true) {
+			try {
+				lexeme = ik.next();
+			} catch (IOException e) {
+				log.error("【策略模块-敏感词校验】IK分词器处理短信内容异常" + "\n e={}", e.getMessage());
+				e.printStackTrace();
+			}
+			if (lexeme == null) {
+				break;
+			}
+			set.add(lexeme.getLexemeText());
+		}
+		end = System.currentTimeMillis();
+		log.info("【策略模块-敏感词校验】分词耗时：{}ms", end - start);
+		//交集
+		Set<Object> result = cacheClient.sinterStr(submit.getSequenceId().toString(), CacheConstant.DIRTY_WORD, set.toArray(new String[0]));
+
+		if (result != null && !result.isEmpty()) {
+			log.error("【策略模块-敏感词校验】短信内容包含敏感词：{}", result);
+			throw new RuntimeException("短信内容包含敏感词");
+		}
+		log.info("【策略模块-敏感词校验】敏感词校验通过");
 	}
 }
--- a/beacon-strategy/src/main/java/com/mashibing/strategy/utils/DirtyWordTree.java
+++ b/beacon-strategy/src/main/java/com/mashibing/strategy/utils/DirtyWordTree.java
@ -0,0 +1,116 @@
+package com.mashibing.strategy.utils;
+
+import com.mashibing.common.constant.CacheConstant;
+import com.mashibing.strategy.feignclient.CacheClient;
+
+import java.util.HashMap;
+import java.util.HashSet;
+import java.util.Map;
+import java.util.Set;
+
+/**
+ * @author heqijun
+ * @ClassName: DirtyWordTree
+ * @Description: 敏感词树工具类
+ * @date 2025/6/8 21:23
+ */
+
+public class DirtyWordTree {
+
+	private static final Map DIRTY_WORD_TREE = new HashMap<>();
+
+	static {
+		//通过SpringUtil，获取Spring中的CacheClient对象
+		CacheClient cacheClient = (CacheClient) StringUtil.getBeanByClass(CacheClient.class);
+		//调用缓存模块接口获取全部敏感词
+		Set<String> dirtyWords = cacheClient.smember(CacheConstant.DIRTY_WORD);
+		//构建敏感词树
+		buildTree(dirtyWords);
+	}
+
+	/**
+	 * 构建敏感词树
+	 * 基于dfa算法实现敏感词树
+	 * 原理：整体结构是一个map，每个词的第一个字都是key，每个字key的value都是一个map
+	 * 字对应的map里存【以当前字结尾是否是敏感词】和下一个字key和value的map
+	 *
+	 * @param dirtyWordsSet 敏感词列表
+	 */
+	private static void buildTree(Set<String> dirtyWordsSet) {
+		Map<String, Map> currentMap;
+		//遍历每个词
+		for (String dirtyWord : dirtyWordsSet) {
+			//外层循环中每次都要指定当前map为最外层map
+			currentMap = DIRTY_WORD_TREE;
+			for (int i = 0; i < dirtyWord.length(); i++) {
+				//获取词中的每个字
+				String singleWord = String.valueOf(dirtyWord.charAt(i));
+				//如果当前字不在当前层的map中，则添加进去
+				if (!currentMap.containsKey(singleWord)) {
+					currentMap.put(singleWord, new HashMap());
+				}
+				//当前字对应的map
+				Map currentWordMap = currentMap.get(singleWord);
+				//如果当前字的map中妹有isEnd，说明这是刚添进去的字，要指定isEnd
+				if (!currentWordMap.containsKey("isEnd") && i < dirtyWord.length() - 1) {
+					//如果没到当前词末尾，说明不是敏感词，指定为false
+					currentWordMap.put("isEnd", false);
+				} else if (i == dirtyWord.length() - 1) {
+					//如果到了当前词末尾，说明是敏感词，指定为true
+					currentWordMap.put("isEnd", true);
+				}
+				//每个词的循环中，下一个字要进到下一层map中
+				currentMap = currentWordMap;
+			}
+		}
+	}
+
+	/**
+	 * 匹配敏感词并返回结果
+	 *
+	 * @param text 要匹配的文本
+	 * @return 匹配结果
+	 */
+	public static Set<String> getDirtyWord(String text) {
+
+		//拿到敏感词树
+		Map currentMap;
+		Set<String> result = new HashSet<>();
+
+		//遍历文本
+		for (int i = 0; i < text.length(); i++) {
+			currentMap = DIRTY_WORD_TREE;
+			//记录匹配上的敏感字的长度
+			int dirtyLength = 0;
+			boolean isDirty = false;
+			for (int j = i; j < text.length(); j++) {
+				//当前字
+				String currentWord = String.valueOf(text.charAt(j));
+				currentMap = (Map) currentMap.get(currentWord);
+				if (currentMap == null) {
+					//没匹配上，直接break
+					break;
+				}
+				//匹配上了
+				dirtyLength++;
+				//判断是否是敏感词，不是的话，继续下一个字
+				if ((Boolean) currentMap.get("isEnd")) {
+					//是敏感词，退出循环，记录匹配到的敏感词
+					isDirty = true;
+					break;
+				}
+			}
+
+			if (isDirty) {
+				//记录匹配到的敏感词
+				result.add(text.substring(i, i + dirtyLength));
+			}
+
+		}
+
+		return result;
+	}
+
+	private DirtyWordTree() {
+	}
+}
--- a/beacon-strategy/src/main/java/com/mashibing/strategy/utils/StringUtil.java
+++ b/beacon-strategy/src/main/java/com/mashibing/strategy/utils/StringUtil.java
@ -0,0 +1,32 @@
+package com.mashibing.strategy.utils;
+
+import org.springframework.beans.BeansException;
+import org.springframework.context.ApplicationContext;
+import org.springframework.context.ApplicationContextAware;
+import org.springframework.stereotype.Component;
+
+/**
+ * @author heqijun
+ * @ClassName: StringUtil
+ * @Description: 用于在非ioc管理的类中使用spring中的bean
+ * @date 2025/6/8 23:09
+ */
+
+@Component
+public class StringUtil implements ApplicationContextAware {
+
+	private static ApplicationContext applicationContext;
+
+	@Override
+	public void setApplicationContext(ApplicationContext applicationContext) throws BeansException {
+		StringUtil.applicationContext = applicationContext;
+	}
+
+	public static Object getBeanByName(String beanName) {
+		return applicationContext.getBean(beanName);
+	}
+
+	public static Object getBeanByClass(Class<?> clazz) {
+		return applicationContext.getBean(clazz);
+	}
+}
--- a/beacon-test/src/test/java/com/mashibing/test/mapper/ClientBusinessMapperTest.java
+++ b/beacon-test/src/test/java/com/mashibing/test/mapper/ClientBusinessMapperTest.java
@ -27,6 +27,7 @@ class ClientBusinessMapperTest {
 		ClientBusiness cb = mapper.findById(1L);
 		cb.setIpAddress("192.168.1.5");
 		cb.setClientFilters("phase," + cb.getClientFilters());
+		cb.setClientFilters( cb.getClientFilters().replace("dirtyword","dfaDirtyword"));
 		System.out.println(cb);
 		ObjectMapper mapper = new ObjectMapper();
 		cacheClient.hset("client_business:" + cb.getApikey(), mapper.convertValue(cb, Map.class));
Author	SHA1	Message	Date
heqijun	b40a765165	处理类描述中的TODO	3 months ago
heqijun	2a3eb2c486	实现敏感词校验功能（基于redis交集操作以及dfa敏感词树两种方式实现）	3 months ago