实现不仅做出逐出决策还包含采样成对偏好查询的这些功能作为仅元数据的幽灵缓存进行构建和管理类似于等经典策略。在任何给定的查找请求之后除了常规的缓存操作之外还会进行更新动态内部表示所需的簿记例如跟踪和更新容量受限的键值存储中的特征元数据。这包括由用户作为输入提供的外部标记特征以及缓存查找请求以及根据观察到的查找时间构建的内部构造的动态特征例如自上次访问以来的时间访问之间的平均时间每一个项目。从随机权重初始化开始完全在线学习其奖励模型。这似乎是一个坏主意特别是如果决策专门用于优化奖励模型的话。
然而驱逐决策依赖于学习到的奖励模型和次优但简单而强大的启发式算法如。当奖励模型完全泛化时这可以实现最佳性能同时对尚未泛化的暂时无信息的奖励模型或在赶上不断变化的环 美国手机数据列表 境的过程中保持鲁棒性。在线培训的另一个优势是专业化。每个缓存服务器都在可能不同的环境例如地理位置中运行这会影响本地网络条件以及本地流行的内容等。与单一的离线培训解决方案相反在线培训会自动捕获这些信息同时减少泛化的负担。对随机优先级队列中的样本进行评分由于两个原因通过专门学习的目标来优化驱逐决策的质量可能是不切实际的。计算效率限制使用学习网络进行推理可能比大规模运行的实际缓存策略中执行的计算要昂贵得多。

能在改善医疗诊断方面有着巨大的潜力。但人工智能相关健康诊断算法的安全性公平性和可靠性取决于多样化且平衡的训练数据集。健康诊断领域的一个公开挑战是缺乏来自历史边缘群体的训练样本数据。与社区和专家合作针对数据差距问题提出定性和定量因果理论。这些理论包括构成健康诊断更广泛社会背景的关键因素包括对死亡的文化记忆和对医疗保健的信任。下图描绘了上述合作过程中生成的因果理论。它假设对医疗保健的信任会影响这个复杂系统的所有部分并且是增加筛查的关键杠杆而筛查反过来又会生成数据以克服数据多样性差距。健康诊断数据缺口的因果循环图这些源于社区的因果理论是用值得信赖的社会背景知识弥合问题理解鸿沟的第一步。