共找到 9 个提示词
金融数据获取与清洗方案:股票/基金/期货/宏观数据的免费与付费数据源对比、Python爬取模板(Tushare/AkShare/Baostock/Wind API)、数据清洗pipeline(缺失值/异常值/复权/对齐)。让数据准备从'最耗时的环节'变成'几行代码的事'
Airflow实战指南:DAG设计模式→Operator选型→动态DAG生成→XCom数据传递→SLA与告警→回填(Backfill)→Sensor设计→执行器选择→生产环境运维→DAG版本管理
设计数据湖架构:数据湖vs数据仓库的选择→分层存储(Bronze/Silver/Gold)→Delta Lake/Iceberg/Hudi表格式→Schema演进→ACID事务→元数据管理→数据治理→查询引擎(Trino/Presto/Spark)
构建数据质量框架:六维度质量评估(完整性/准确性/一致性/及时性/唯一性/有效性)→自动化质量检查→异常告警→数据血缘→质量Dashboard→Great Expectations/Soda/Deequ工具实战
设计数据仓库模型:维度建模方法论→事实表与维度表→星型模型vs雪花模型→缓慢变化维(SCD Type1/2/3)→聚合表设计→ETL物化策略→与数据湖的互补
dbt数据工程实战:项目结构→Model分层(staging/intermediate/mart)→Jinja宏→测试(Generic+Singular)→文档自动生成→增量模型→Snapshot→CI/CD集成→与Airflow/Prefect的配合
根据并发场景生成正确的Go并发代码:Pipeline模式→扇出扇入→超时控制→context传递→errgroup错误处理→并发安全的map/slice→goroutine泄漏检测→pprof性能分析
描述数据源和清洗目标,自动生成Pandas/NumPy数据处理脚本:缺失值处理→异常值检测→数据类型转换→聚合统计→结果导出。附带数据质量报告
设计Serverless架构:Lambda函数设计模式→API Gateway配置→Step Functions编排→DynamoDB单表设计→EventBridge事件总线→冷启动优化→成本分析→适用场景和局限→从EC2迁移策略