跳转到内容
188体育官网app下载
188体育官网app下载
Domino企业MLOps平台188bet最新网站188体育官网app下载
188体育官网app下载平台组件
记录制度
综合示范工厂
自助服务基础设施门户
探索
定价
联系
188体育官网app下载平台更新
188体育官网app下载
188bet登录入口
按角色
188bet登入官网
188金宝慱亚洲体育网址数据科学领导者
数据科学家
188bet登录网址
由工业
188beat365体育
188betcom
保险
188bet登录入口
用例
自助数据科学188金宝慱亚洲体育网址
开放数据科188金宝慱亚洲体育网址学
118bet金博宝
118bet金博宝app
188bet登录入口
客户
188beat365体育
指南,视频和更多
博客
事件
播客
学习
社区
文档
合作伙伴
合作伙伴
工具和数据
基础设施
解决方案
实施与咨询
成为合作伙伴
特色
英伟达
AWS
Azure
埃森哲咨询公司
雪花
合作伙伴
188beat365
188beat365
职业生涯
我们正在招聘
新闻与新闻
联系
观看演示
现在试一试
188体育官网app下载
Domino企业MLOps平台188bet最新网站188体育官网app下载
记录制度
综合示范工厂
自助服务基础设施门户
定价
联系
188体育官网app下载平台更新
自助数据科学188金宝慱亚洲体育网址
开放数据科188金宝慱亚洲体育网址学
118bet金博宝
118bet金博宝app
188bet登录入口
188金宝慱亚洲体育网址数据科学领导者
188bet登录网址
数据科学家
188bet登入官网
188beat365体育
保险
媒体与科技
188betcom
制造业
零售,电子商务和消费产品
客户
188beat365体育
指南,视频和更多
188金宝慱亚洲体育网址数据科学博客
企业现场指南
事件
播客
学习
社区
文档
比较指南
合作伙伴
工具和数据
基础设施
解决方案
实施与咨询
成为合作伙伴
188beat365
188beat365
职业生涯
我们正在招聘
新闻与新闻
联系
观看演示
现在试一试
字典
字典的菜单
气流
水蟒
Apache火花
人工智能
Dask
188金宝慱亚洲体育网址
Density-Based集群
dplyr
因子分析
工程特性
特征选择
叶形
GenomicRanges
ggmap
ggplot
GPU
地面实况
哈希表
Hyperparameter调优
可解释性
Jupyter笔记本
Kubernetes
机器学习
MLOps
模型的漂移
模型评价
模型的监控
模型选择
模型优化
过度拟合
情节
PySpark
PyTorch
闪闪发光(R)
sklearn
宽大的
TensorFlow
Underfitting
XGBoost
气流
水蟒
Apache火花
人工智能
Dask
188金宝慱亚洲体育网址
Density-Based集群
dplyr
因子分析
工程特性
特征选择
叶形
GenomicRanges
ggmap
ggplot
GPU
地面实况
哈希表
Hyperparameter调优
可解释性
Jupyter笔记本
Kubernetes
机器学习
MLOps
模型的漂移
模型评价
模型的监控
模型选择
模型优化
过度拟合
情节
PySpark
PyTorch
闪闪发光(R)
sklearn
宽大的
TensorFlow
Underfitting
XGBoost
气流
Apache风流是一个强大的开源工具,可以帮助您编写、调度和监控工作流。Airbnb在2014年创建了“气流”,以帮助管理其数据处理需求,并已成为整个行业数据科学家的一个影响深远的工具。
水蟒
Anaconda是用于数据科学的Python和R编程语言的开源发行版,旨在简化包的管理和部署。188金宝慱亚洲体育网址Anaconda中的包版本由包管理系统conda管理,该系统在执行安装之前分析当前环境,以避免破坏其他框架和包。
Apache火花
Apache Spark是一个开源的分布式计算框架和一组库,用于实时、大规模的数据处理。Spark于2009年在加州大学伯克利分校创建,以解决Apache Hadoop的许多缺点,并且在分析工作负载方面比Hadoop快得多,因为它将数据存储在内存(RAM)而不是磁盘上。
人工智能
人工智能(AI)是一类能够执行通常需要人类智能的任务的解决方案。如果你用手机和Siri说话,与电脑玩竞技游戏,或乘坐自动驾驶汽车,你都是在与人工智能互动。
Dask
Dask于2018年发布,旨在创建一个强大的并行计算框架,对Python用户非常有用,可以在一台笔记本电脑或集群上良好运行。与Apache Spark相比,Dask重量更轻,更容易集成到现有的代码和硬件中。
188金宝慱亚洲体育网址
188金宝慱亚洲体育网址数据科学是一门学科,它在复杂的数据集中寻找模式,以建立模型来预测未来可能发生的事情和/或解释系统。188金宝慱亚洲体育网址数据科学结合了领域专业知识、编程技能以及数学和统计学知识,从数据中提取有意义的见解。
Density-Based集群
基于密度的聚类(density - based Clustering)是一种无监督的机器学习方法,它可以识别数据中不同的簇,这种方法基于这样一种思想:数据空间中的一个簇/组是一个高密度的连续区域,通过稀疏区域将其他簇隔开。分离稀疏区域中的数据点通常被认为是噪声/异常值。
dplyr
Dplyr(发音为“deep -ply-er”)是r中用于数据整理的杰出工具。学习和使用Dplyr可以帮助数据科学家更快、更容易理解数据准备和管理过程。数据科学家通常使用dplyr将现有数据集转换为更适合某些特定类型的分析或数据可视化的格式。
因子分析
因子分析是一种统计方法,用来描述观察到的相关变量之间的可变性,用潜在数量较少的未观察到的变量称为因子。例如,有可能六个观察到的变量的变化主要反映了两个未观察到的(潜在的)变量的变化。
工程特性
特征工程指的是对数据集的操作——添加、删除、组合、突变——以改进机器学习模型训练,从而获得更好的性能和更高的精度。有效的特性工程基于对业务问题和可用数据源的充分了解。
特征选择
特征选择是从数据中选择输入特征的一个子集用于模型以减少噪声的过程。
叶形
Folium是一个功能强大的Python库,可以帮助您创建多种类型的传单映射。默认情况下,Folium在一个单独的HTML文件中创建一个映射。由于Folium结果是交互式的,因此这个库对于构建仪表板非常有用。您还可以在Folium中创建内联Jupyter映射。
GenomicRanges
基因组范围包是在生物导体项目中表示基因组位置的基础。这个R包通过引入三个类(GRanges、GPos和GRangesList)为基因组分析奠定了基础,它们用于表示基因组范围、基因组位置和基因组范围的组。
ggmap
ggmap是一个R包,可以方便地从流行的在线地图服务(如谷歌Maps和Stamen Maps)检索光栅地图贴图,并使用ggplot2框架绘制它们。其结果是一个简单的、一致的、模块化的空间图形框架,具有几个用于空间数据分析的工具。
ggplot
ggplot2是用于统计编程语言r的数据可视化包。ggplot2是Leland Wilkinson的图形语法的实现,这是一种数据可视化方案,它将图形分解为语义组件,如标度和层。ggplot2是R中基本图形的替代方案,它包含许多默认的绘图。
GPU
图形处理单元(GPU)是一种专门设计用于快速操作和改变内存以加速计算机图形和图像处理的电路。现代gpu的高度并行结构使得它们在并行处理大块数据的算法上比中央处理器(cpu)更高效。
地面实况
机器学习中的基本真相是指你想用监督机器学习算法建模的现实。Ground truth也被称为使用标记数据集进行训练或验证模型的目标。
哈希表
哈希表是一种数据结构,其中数据元素的地址/索引值由哈希函数生成。这支持非常快速的数据访问,因为索引值作为数据值的键。
Hyperparameter调优
超参数调优是为任何给定的机器学习算法寻找最优超参数的过程。
可解释性
可解释的机器学习意味着人类可以从包含在数据中或由模型学习的关系的模型中捕获相关知识。机器学习算法历来都是“黑盒子”,无法理解其内部过程,也难以向监管机构和利益相关者解释由此产生的见解。
Jupyter笔记本
Jupyter Notebook(以前称为IPython Notebook)是一个用于创建和共享计算文档的交互式web应用程序。
Kubernetes
Kubernetes是一个开源的容器编制系统,用于自动化应用程序部署、伸缩和管理。开发Kubernetes(又名K8s)是为了管理在生产环境中运行的多个容器(如Docker)和主机的复杂体系结构。随着IT部门向集成化应用程序和微服务的发展,k8正迅速成为它们的关键。
机器学习
机器学习(ML)是通过经验自动改进的计算机算法的应用。机器学习算法基于样本数据(称为“训练数据”)构建模型,以便在没有明确编程的情况下做出预测或决策。
MLOps
机器学习操作(MLOps)是一组技术和最佳实践,可在不同的企业中大规模地简化数据科学模型的管理、开发、部署和监视。188金宝慱亚洲体育网址
模型的漂移
模型漂移是由于现实环境的变化而导致模型预测能力的衰减。
模型评价
模型评估是使用不同的评估指标来了解机器学习模型的性能及其优缺点的过程。模型评价是在研究初期评估模型有效性的重要手段,同时也是模型监测的重要手段。
模型的监控
模型监控是机器学习生命周期中模型部署之后的一个操作阶段。它需要监视您的ML模型的变化,例如模型退化、数据漂移和概念漂移,并确保您的模型保持可接受的性能水平。
模型选择
模型选择是根据不同的标准,如鲁棒性和模型复杂性,从所有可用模型中选择一个特定业务问题的最佳模型的过程。
模型优化
模型调优是寻找超参数的最优值以使模型性能最大化的实验过程。
过度拟合
过拟合描述了这样一种现象:模型对训练集中的噪声过于敏感,导致它不能对新的和以前未见的数据进行泛化,或者泛化效果很差。
情节
py,通俗地称为Plotly,是一个交互式的、开源的、基于浏览器的图形库。
PySpark
PySpark是用于Apache Spark的Python API, Apache Spark是一个开源的分布式计算框架 和一组用于实时、大规模数据处理的库。如果您已经熟悉Python和Pandas等库,那么PySpark是学习创建更多可扩展分析和管道的好语言。
PyTorch
PyTorch是一个开源的机器学习库,由Facebook的AI研究实验室于2016年发布。它可以用于一系列任务,但特别专注于深度学习任务的训练和推理,如计算机视觉和自然语言处理。
闪闪发光(R)
Shiny是一个R包,它能够构建能够在后台执行R代码的交互式web应用程序。使用Shiny,你可以在网页上托管独立的应用程序,在R Markdown文档中嵌入交互式图表,或者构建仪表板。您还可以使用CSS主题、HTML小部件和JavaScript操作来扩展您的Shiny应用程序。
sklearn
Scikit-learn,也被称为sklearn,是一个面向Python的开源机器学习和数据建模库。它具有各种分类、回归和聚类算法,包括支持向量机、随机森林、梯度增强、k-means和DBSCAN,并设计用于与Python库NumPy和SciPy互操作。
宽大的
space是一个免费的、开放源码的Python库,它提供了对大量文本进行高速自然语言处理(NLP)的高级功能。它可以帮助您构建支持文档分析、聊天机器人功能和所有其他形式的文本分析的模型和生产应用程序。
TensorFlow
TensorFlow是一个用于机器学习的开源框架。它拥有一个由工具、库和社区资源组成的全面生态系统,让开发人员可以轻松地构建和部署ML驱动的应用程序,研究人员也可以在ML方面进行创新。它188beat365体育可以用于一系列任务,但特别专注于深度神经网络的训练和推理。
Underfitting
欠拟合描述了一种模型,该模型没有捕获训练它的数据集中的底层关系。
XGBoost
XGBoost是一种开源的集成机器学习算法,它利用了梯度增强决策树的高性能实现。底层c++代码库与顶层的Python接口相结合,使XGBoost成为一个非常快速、可扩展和高度可用的库。
返回索引
map