跳到内容
188bet官方平台
188体育官网app下载
Domino企业MLOps平台188bet最新网站188体育官网app下载
188体育官网app下载平台组件
记录制度
综合模型工厂
自助服务基础设施门户
代码辅助
探索
定价
联系
188体育官网app下载平台更新
188bet官方网站入口
188bet官方平台
188bet登录入口
按角色
188bet登入官网
188金宝慱亚洲体育网址数据科学领导者
数据科学家
188bet登录网址
由工业
188beat365体育
188betcom
保险
188bet登录入口
用例
自助式数据科学188金宝慱亚洲体育网址
开放数据科188金宝慱亚洲体育网址学
118bet金博宝
118bet金博宝app
Upskill人才
188bet登录入口
客户
188beat365体育
指南,视频和更多
博客
事件
播客
学习
社区
文档
合作伙伴
合作伙伴
工具与数据
基础设施
解决方案
实施与咨询
成为合作伙伴
特色
英伟达
AWS
Azure
埃森哲咨询公司
雪花
合作伙伴
188beat365
188beat365
职业生涯
我们正在招聘
新闻及出版
联系
参加每周演示
188bet官方平台
Domino企业MLOps平台188bet最新网站188体育官网app下载
记录制度
综合模型工厂
自助服务基础设施门户
低码助手
定价
联系
188体育官网app下载平台更新
自助式数据科学188金宝慱亚洲体育网址
开放数据科188金宝慱亚洲体育网址学
118bet金博宝
118bet金博宝app
188bet登录入口
188金宝慱亚洲体育网址数据科学领导者
188bet登录网址
数据科学家
188bet登入官网
188beat365体育
保险
媒体与科技
188betcom
制造业
零售,电子商务和消费产品
AI Upskiling
客户
188beat365体育
指南,视频和更多
188金宝慱亚洲体育网址数据科学博客
企业实地指南
事件
播客
学习
社区
文档
合作伙伴
工具与数据
基础设施
解决方案
实施与咨询
成为合作伙伴
188beat365
188beat365
职业生涯
我们正在招聘
新闻及出版
联系
观看演示
字典
字典的菜单
气流
水蟒
Apache火花
人工智能
Dask
188金宝慱亚洲体育网址
Density-Based集群
dplyr
因子分析
工程特性
特征选择
叶形
GenomicRanges
ggmap
ggplot
GPU
地面实况
哈希表
Hyperparameter调优
可解释性
Jupyter笔记本
Kubernetes
机器学习
MLOps
模型的漂移
模型评价
模型的监控
模型选择
模型优化
过度拟合
情节
PySpark
PyTorch
闪亮(R字)
sklearn
宽大的
TensorFlow
Underfitting
XGBoost
气流
水蟒
Apache火花
人工智能
Dask
188金宝慱亚洲体育网址
Density-Based集群
dplyr
因子分析
工程特性
特征选择
叶形
GenomicRanges
ggmap
ggplot
GPU
地面实况
哈希表
Hyperparameter调优
可解释性
Jupyter笔记本
Kubernetes
机器学习
MLOps
模型的漂移
模型评价
模型的监控
模型选择
模型优化
过度拟合
情节
PySpark
PyTorch
闪亮(R字)
sklearn
宽大的
TensorFlow
Underfitting
XGBoost
气流
Apache Airflow是一个强大的开源工具,可以帮助您编写、调度和监控工作流。Airbnb在2014年创建了“气流”,以帮助管理其数据处理需求,并从此成为整个行业数据科学家的一个影响深远的工具。
水蟒
Anaconda是用于数据科学的Python和R编程语言的开源发行版,旨在简化包的管理和部署。188金宝慱亚洲体育网址Anaconda中的包版本由包管理系统conda管理,该系统在执行安装之前分析当前环境,以避免干扰其他框架和包。
Apache火花
Apache Spark是一个开源的分布式计算框架和一组用于实时、大规模数据处理的库。Spark于2009年在加州大学伯克利分校创建,旨在解决Apache Hadoop的许多缺点,并且在分析工作负载方面比Hadoop快得多,因为它将数据存储在内存(RAM)而不是磁盘上。
人工智能
人工智能(AI)是一类能够执行通常需要人类智能才能完成的任务的解决方案。如果你在手机上与Siri交谈,与电脑玩竞技游戏,或者乘坐自动驾驶汽车,你都是在与人工智能互动。
Dask
Dask于2018年发布,旨在创建一个强大的并行计算框架,对Python用户非常有用,并且可以在单个笔记本电脑或集群上运行良好。与Apache Spark相比,Dask重量更轻,更容易集成到现有代码和硬件中。
188金宝慱亚洲体育网址
188金宝慱亚洲体育网址数据科学是一门学科,它在复杂的数据集中寻找模式,以建立预测未来可能发生的事情和/或解释系统的模型。188金宝慱亚洲体育网址数据科学结合了领域专业知识、编程技能以及数学和统计学知识,从数据中提取有意义的见解。
Density-Based集群
基于密度的聚类是一种无监督的机器学习方法,它基于这样的思想:数据空间中的聚类/组是一个高点密度的连续区域,通过稀疏区域与其他聚类分开。在分离的稀疏区域中的数据点通常被认为是噪声/离群值。
dplyr
Dplyr(发音为“deep -ply-er”)是r语言中卓越的数据整理工具。学习和使用Dplyr可以帮助数据科学家更快、更容易地理解数据准备和管理过程。数据科学家通常使用dplyr将现有数据集转换为更适合某些特定类型的分析或数据可视化的格式。
因子分析
因子分析是一种统计方法,用于描述观察到的相关变量之间的可变性,根据潜在的较少数量的未观察到的变量称为因素。例如,六个观测变量的变化可能主要反映了两个未观测(潜在)变量的变化。
工程特性
特征工程指的是对数据集的操作——添加、删除、组合、突变——以改进机器学习模型训练,从而获得更好的性能和更高的准确性。有效的特征工程是基于对业务问题的充分了解和可用的数据源。
特征选择
特征选择是我们从数据中为模型选择输入特征子集以降低噪声的过程。
叶形
Folium是一个强大的Python库,可以帮助您创建几种类型的传单地图。默认情况下,Folium在一个单独的HTML文件中创建一个地图。由于Folium结果是交互式的,所以这个库对于仪表板构建非常有用。您还可以在Folium中创建内联Jupyter映射。
GenomicRanges
GenomicRanges包是Bioconductor项目中表示基因组位置的基础。这个R包通过引入三个类(GRanges、GPos和GRangesList)为基因组分析奠定了基础,这三个类用于表示基因组范围、基因组位置和基因组范围组。
ggmap
ggmap是一个R包,它可以很容易地从流行的在线地图服务(如Google Maps和Stamen Maps)中检索栅格地图,并使用ggplot2框架绘制它们。其结果是一个简单、一致和模块化的空间图形框架,具有几个用于空间数据分析的工具。
ggplot
ggplot2是统计编程语言r的数据可视化包。ggplot2是Leland Wilkinson的图形语法的实现,这是一种数据可视化方案,它将图形分解为诸如尺度和层之类的语义组件。ggplot2是R中基本图形的替代方案,包含许多绘图默认值。
GPU
图形处理单元(GPU)是一种专门的电路,用于快速操纵和改变内存,以加速计算机图形和图像处理。现代gpu的高度并行结构使其在并行处理大数据块的算法方面比中央处理器(cpu)更高效。
地面实况
机器学习中的基础事实指的是你想用监督机器学习算法建模的现实。Ground truth也被称为训练或验证带有标记数据集的模型的目标。
哈希表
哈希表是一种数据结构,其中数据元素的地址/索引值是由哈希函数生成的。这可以实现非常快速的数据访问,因为索引值充当数据值的键。
Hyperparameter调优
超参数调优是为任何给定的机器学习算法找到最优超参数的过程。
可解释性
可解释的机器学习意味着人类可以从模型中获取有关数据中包含的关系或模型学习的关系的相关知识。机器学习算法在历史上一直是“黑盒子”,无法理解其内部过程,也很难向监管机构和利益相关者解释由此产生的见解。
Jupyter笔记本
Jupyter Notebook(以前称为IPython Notebook)是一个用于创建和共享计算文档的交互式web应用程序。
Kubernetes
Kubernetes是一个开源的容器编排系统,用于自动化应用程序部署、扩展和管理。Kubernetes(又名k8)是为了管理生产环境中运行的多个容器(例如Docker)和主机的复杂架构而开发的。随着IT部门转向容器化应用程序和微服务,k8正迅速成为IT部门的必需品。
机器学习
机器学习(ML)是通过经验自动改进的计算机算法的应用。机器学习算法基于被称为“训练数据”的样本数据建立模型,以便在没有明确编程的情况下做出预测或决策。
MLOps
机器学习操作(MLOps)是一组技术和最佳实践,可以简化跨不同企业的大规模数据科学模型的管理、开发、部署和监控。188金宝慱亚洲体育网址
模型的漂移
模型漂移是模型预测能力的衰减,是现实世界环境变化的结果。
模型评价
模型评估是使用不同的评估指标来理解机器学习模型的性能及其优缺点的过程。模型评价是研究初期评估模型有效性的重要环节,在模型监测中也起着重要作用。
模型的监控
模型监控是机器学习生命周期中模型部署之后的一个操作阶段。它需要监视您的ML模型的变化,例如模型退化、数据漂移和概念漂移,并确保您的模型保持可接受的性能水平。
模型选择
模型选择是基于鲁棒性和模型复杂性等不同标准,从所有可用模型中为特定业务问题选择最佳模型的过程。
模型优化
模型调优是寻找超参数的最优值以使模型性能最大化的实验过程。
过度拟合
过度拟合描述了一种现象,在这种现象中,模型对其训练集中的噪声过于敏感,导致它不能泛化,或者对新的和以前未见过的数据泛化得很差。
情节
py,通俗地称为Plotly,是一个交互式的、开源的、基于浏览器的绘图库。
PySpark
PySpark是Apache Spark的Python API,它是一个开源的分布式计算框架 ,是一组用于实时、大规模数据处理的库。如果您已经熟悉Python和Pandas等库,那么PySpark是学习创建更具可扩展性的分析和管道的好语言。
PyTorch
PyTorch是一个开源的机器学习库,由Facebook的人工智能研究实验室于2016年发布。它可以用于一系列任务,但特别侧重于深度学习任务的训练和推理,如计算机视觉和自然语言处理。
闪亮(R字)
Shiny是一个R包,它支持构建可以在后端执行R代码的交互式web应用程序。有了Shiny,你可以在网页上托管独立的应用程序,在R Markdown文档中嵌入交互式图表,或者构建仪表板。您还可以使用CSS主题、HTML小部件和JavaScript操作扩展Shiny应用程序。
sklearn
Scikit-learn,也被称为sklearn,是一个开源的Python机器学习和数据建模库。它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度增强,k-means和DBSCAN,并且旨在与Python库NumPy和SciPy进行互操作。
宽大的
spaCy是一个免费的开源Python库,它提供了对大量文本进行高速自然语言处理(NLP)的高级功能。它可以帮助您构建可以支持文档分析、聊天机器人功能和所有其他形式的文本分析的模型和生产应用程序。
TensorFlow
TensorFlow是一个机器学习的开源框架。它拥有一个由工具、库和社区资源组成的全面生态系统,可以让开发人员轻松构建和部署机器学习驱动的应用程序,让研究人员在机器学习方面进行创新。188beat365体育它可以用于一系列任务,但特别专注于深度神经网络的训练和推理。
Underfitting
欠拟合描述的是一个模型,它没有捕捉到它所训练的数据集中的潜在关系。
XGBoost
XGBoost是一个开源的集成机器学习算法,它利用了梯度增强决策树的高性能实现。底层的c++代码库与上面的Python接口相结合,使XGBoost成为一个非常快速、可扩展且高度可用的库。
返回索引
map