共找到 6 个提示词
Airflow实战指南:DAG设计模式→Operator选型→动态DAG生成→XCom数据传递→SLA与告警→回填(Backfill)→Sensor设计→执行器选择→生产环境运维→DAG版本管理
Kafka架构深度设计:Topic/Partition/Consumer Group→生产者确认与幂等→消费者Offset管理→消息语义(At-most-once/At-least-once/Exactly-once)→压缩策略→数据保留→与RabbitMQ/Pulsar/NATS对比→多数据中心复制(MirrorMaker)→Kafka Streams vs Flink
设计数据湖架构:数据湖vs数据仓库的选择→分层存储(Bronze/Silver/Gold)→Delta Lake/Iceberg/Hudi表格式→Schema演进→ACID事务→元数据管理→数据治理→查询引擎(Trino/Presto/Spark)
设计NLP处理流水线:文本预处理→分词/分句→命名实体识别→关系抽取→文本分类→情感分析→摘要生成→实体链接→多语言支持→模型更新策略→在线vs批处理
设计实时流处理系统:事件时间vs处理时间→Watermark→窗口(Tumbling/Hopping/Session)→状态管理→Checkpoint→Exactly-Once语义→CEP复杂事件处理→与批处理的Lambda/Kappa架构
设计推荐系统架构:召回层(协同过滤/向量召回/GBDT+LR)→排序层(CTR预估/多目标优化)→重排序层(多样性/新鲜度/业务规则)→实时特征→冷启动→A/B实验→在线学习