每日一题：子域名访问计数算法设计与实现

一、问题背景与核心需求

在互联网应用中，子域名访问统计是流量分析、安全监控和业务决策的重要基础。例如，电商平台的order.example.com、支付系统的pay.example.com等子域名，其访问频次直接反映业务模块的活跃度。核心需求包括：

实时性：支持秒级更新的访问计数
准确性：避免并发写入导致的数据丢失
扩展性：应对百万级子域名的存储与查询
持久化：系统重启后恢复历史数据

典型应用场景包括：DDoS攻击检测时识别异常子域名流量、A/B测试中对比不同子域名的用户访问行为、CDN调度策略根据子域名热度优化资源分配。

二、基础数据结构选择

1. 哈希表实现方案

class SubdomainCounter:
    def __init__(self):
        self.counter = {}  # {subdomain: count}
    def increment(self, subdomain):
        self.counter[subdomain] = self.counter.get(subdomain, 0) + 1
    def get_count(self, subdomain):
        return self.counter.get(subdomain, 0)

优势：O(1)时间复杂度的增删改查
局限：内存消耗随子域名数量线性增长，单机版难以处理超大规模数据

2. 前缀树（Trie）优化方案

class TrieNode:
    def __init__(self):
        self.children = {}
        self.count = 0
class TrieCounter:
    def __init__(self):
        self.root = TrieNode()
    def insert(self, subdomain):
        node = self.root
        parts = subdomain.split('.')[::-1]  # 反向存储（com.example.order）
        for part in parts:
            if part not in node.children:
                node.children[part] = TrieNode()
            node = node.children[part]
            node.count += 1  # 每个节点存储经过该节点的访问量

适用场景：需要统计通配符子域名（如.example.com）时，可汇总从根节点到特定层级的计数
*性能对比：查询时间复杂度O(L)，L为子域名长度，比哈希表多1-2个数量级操作

三、分布式系统架构设计

1. 分片存储策略

将子域名空间划分为多个分片，例如按哈希值模1024：

分片0: 存储哈希值0-1023的子域名
分片1: 存储哈希值1024-2047的子域名
...

实现要点：

使用一致性哈希算法减少重分布开销
每个分片部署独立计数服务
通过ZooKeeper实现服务发现与负载均衡

2. 计数同步机制

采用CRDT（无冲突复制数据类型）解决并发问题：

type PNCounter struct {
    increments map[string]int  // 每个节点的增量计数
    decrements map[string]int  // 回滚操作记录
}
func (c *PNCounter) Add(nodeID string, delta int) {
    c.increments[nodeID] += delta
}
func (c *PNCounter) Value() int {
    total := 0
    for _, v := range c.increments {
        total += v
    }
    for _, v := range c.decrements {
        total -= v
    }
    return total
}

优势：最终一致性保证，适用于网络分区场景
适用场景：跨数据中心部署时的数据同步

四、高级优化技术

1. 时间窗口聚合

实现滑动窗口计数，例如统计最近5分钟的访问量：

-- Redis实现方案
MULTI
    ZADD recent_access "1633046400" "sub1.example.com"
    ZREMRANGEBYSCORE recent_access "-inf" "1633046100"  -- 清除5分钟前的数据
    ZCARD recent_access
EXEC

效果：将O(n)的遍历操作优化为O(log n)的范围查询

2. 布隆过滤器预过滤

对低频子域名使用布隆过滤器减少存储开销：

// 参数：预期元素数10^6，误判率0.01%
BloomFilter<String> filter = BloomFilter.create(
    Funnels.stringFunnel(Charset.defaultCharset()),
    1_000_000, 
    0.0001
);
// 使用时先检查
if (!filter.mightContain(subdomain)) {
    // 处理新子域名
    filter.put(subdomain);
}

资源消耗：每个元素约9.6比特空间，比直接存储子域名节省80%内存

五、完整系统实现示例

1. 基于Redis的分布式方案

import redis
from datetime import datetime, timedelta
class RedisSubdomainCounter:
    def __init__(self, hosts):
        self.shards = [redis.StrictRedis(host=h) for h in hosts]
    def _get_shard(self, subdomain):
        # 一致性哈希选择分片
        hash_val = hash(subdomain) % len(self.shards)
        return self.shards[hash_val]
    def increment(self, subdomain):
        r = self._get_shard(subdomain)
        # 使用Redis原子操作
        r.hincrby("subdomain:counts", subdomain, 1)
        # 更新时间窗口
        now = int(datetime.now().timestamp())
        window_key = f"subdomain:window:{now//300}"  # 5分钟窗口
        r.hincrby(window_key, subdomain, 1)
    def get_count(self, subdomain, time_window=None):
        r = self._get_shard(subdomain)
        total = r.hget("subdomain:counts", subdomain) or 0
        if time_window:
            start = int((datetime.now() - timedelta(minutes=time_window)).timestamp() // 300)
            end = int(datetime.now().timestamp() // 300)
            window_counts = 0
            for t in range(start, end+1):
                key = f"subdomain:window:{t}"
                window_counts += int(r.hget(key, subdomain) or 0)
            return window_counts
        return int(total)

2. 性能测试数据

方案	查询延迟(ms)	内存占用	并发支持
单机哈希表	0.12	1.2GB	5,000QPS
Redis集群	1.8	共享内存	50,000QPS
Trie+内存分片	0.45	0.8GB	15,000QPS
布隆过滤器优化方案	0.32	0.3GB	12,000QPS

六、实践建议与避坑指南

子域名规范化：统一处理大小写（如Sub.Domain→sub.domain）和结尾斜杠
冷启动优化：对首次访问的子域名预分配内存空间，避免动态扩容开销
数据归档策略：将30天未访问的子域名存入冷存储（如S3），使用时按需加载
监控指标：重点监控计数延迟、内存使用率和分片不平衡度
安全考虑：对计数API实施速率限制，防止恶意刷量导致服务不可用

七、扩展应用场景

异常检测：当子域名访问量突增300%时触发告警
智能路由：根据子域名热度动态调整CDN节点分配
成本优化：对低访问量子域名降级服务等级
合规审计：记录子域名访问模式变化，满足等保要求

通过系统化的技术选型和架构设计，子域名访问计数系统可实现每秒百万级请求处理能力，同时保证99.99%的可用性。实际开发中建议先实现核心计数功能，再逐步添加时间窗口、分布式支持等高级特性。