百度笔试题技术解析：常见算法与系统设计题解

一、算法题核心类型与解题框架

百度笔试题中的算法题通常覆盖数据结构、动态规划、贪心算法等基础领域，重点考察逻辑严谨性与代码实现能力。

1. 链表与树结构操作

链表反转、二叉树遍历是高频考点。例如，反转单链表要求时间复杂度O(n)、空间复杂度O(1)。其核心思路是通过迭代修改指针指向：

class ListNode:
    def __init__(self, val=0, next=None):
        self.val = val
        self.next = next
def reverseList(head: ListNode) -> ListNode:
    prev, curr = None, head
    while curr:
        next_node = curr.next
        curr.next = prev
        prev = curr
        curr = next_node
    return prev

关键点：需处理空链表、单节点链表等边界条件，并通过注释明确每一步的指针操作。

2. 动态规划与状态转移

背包问题、最长公共子序列（LCS）是典型动态规划题。以0-1背包问题为例，需定义二维数组dp[i][j]表示前i个物品在容量j下的最大价值：

def knapsack(weights, values, capacity):
    n = len(weights)
    dp = [[0] * (capacity + 1) for _ in range(n + 1)]
    for i in range(1, n + 1):
        for j in range(1, capacity + 1):
            if weights[i-1] > j:
                dp[i][j] = dp[i-1][j]
            else:
                dp[i][j] = max(dp[i-1][j], values[i-1] + dp[i-1][j-weights[i-1]])
    return dp[n][capacity]

优化技巧：空间复杂度可从O(n*m)优化至O(m)，通过滚动数组或一维数组实现。

3. 排序与搜索算法

快速排序、二分查找是基础但易错的考点。例如，二分查找的变种题（如查找第一个等于目标值的索引）需调整终止条件：

def binary_search_first(nums, target):
    left, right = 0, len(nums) - 1
    res = -1
    while left <= right:
        mid = left + (right - left) // 2
        if nums[mid] == target:
            res = mid
            right = mid - 1  # 继续向左搜索
        elif nums[mid] < target:
            left = mid + 1
        else:
            right = mid - 1
    return res

常见错误：循环条件写为left < right会导致漏查边界，需严格遵循left <= right。

二、系统设计题考察重点与解题方法

系统设计题侧重架构思维与权衡能力，通常涉及分布式系统、缓存策略、数据库设计等场景。

1. 分布式ID生成器设计

设计一个全局唯一、趋势递增的ID生成服务，需考虑高并发、低延迟与容灾能力。核心方案包括：

雪花算法（Snowflake）：64位ID由时间戳、工作机器ID、序列号组成，支持每秒百万级生成。

数据库自增+分段锁：通过数据库表记录当前最大ID，结合缓存预分配减少数据库访问。
实现示例（雪花算法简化版）：

class Snowflake:
  def __init__(self, worker_id, datacenter_id):
      self.worker_id = worker_id
      self.datacenter_id = datacenter_id
      self.sequence = 0
      self.last_timestamp = -1
  def generate_id(self):
      timestamp = self._current_time()
      if timestamp < self.last_timestamp:
          raise Exception("Clock moved backwards")
      if timestamp == self.last_timestamp:
          self.sequence = (self.sequence + 1) & 0xFFF  # 12位序列号
          if self.sequence == 0:
              timestamp = self._wait_next_ms()
      else:
          self.sequence = 0
      self.last_timestamp = timestamp
      return ((timestamp - 1288834974657) << 22) | \
             (self.datacenter_id << 17) | \
             (self.worker_id << 12) | \
             self.sequence

关键权衡：工作机器ID分配需避免冲突，可通过配置文件或ZooKeeper协调。

2. 短链接服务设计

设计一个将长URL转换为短URL的服务，需考虑存储、查询效率与扩展性。核心步骤包括：

哈希算法选择：使用MurmurHash或CRC32生成哈希值，截取低位作为短码。
存储优化：采用KV数据库（如Redis）存储长URL与短码的映射，设置TTL自动过期。
冲突处理：通过布隆过滤器快速判断短码是否存在，若冲突则重新生成。
性能优化：短码可包含时间戳前缀，减少全局冲突概率；支持自定义短码需额外校验唯一性。

三、笔试答题技巧与注意事项
代码规范：变量命名需清晰（如dp代替arr），添加必要注释说明算法逻辑。
边界条件：主动列举空输入、极端值等场景，并给出处理方案。
复杂度分析：明确时间复杂度与空间复杂度，例如快速排序为O(nlogn)平均复杂度。
系统设计权衡：对比不同方案的优缺点（如数据库分片与缓存的取舍），体现架构思维。

四、总结与提升建议

百度笔试题的技术深度与广度兼具，需通过系统复习与针对性练习提升能力。建议：

算法题：每日刷题（如LeetCode中等难度题），总结动态规划、图论等高频题型。
系统设计：阅读《Designing Data-Intensive Applications》等经典书籍，掌握CAP理论、一致性协议等基础。
模拟面试：与同伴进行模拟笔试，训练时间分配与表达清晰度。
通过结构化解题框架与细节优化，开发者可显著提升笔试通过率，为进入技术岗位奠定坚实基础。