数据导入模块

数据导入是使用 AutoSTAT 进行数据分析的第一步。本章节将介绍如何将数据导入到 AutoSTAT 中。

功能特点

表头表格合并

  • 在实际数据分析中,常见情况是表头文件 (.name) 与 数据文件 (.data) 分离存储。 AutoSTAT 支持同时上传两类文件,自动提取表头,实现表头与数据表的自动合并。

多文件上传

  • AutoSTAT 不仅支持多种数据存储格式,并且对于多文件分离存储情况,支持 横向拼接纵向拼接,可在数据导入后选择拼接方式。

列名含义解析

  • 在数据集中,列名通常以缩写形式出现。 Dataloading Agent 可自动识别并解析这些列名,帮助您快速了解其实际含义。

操作教程

数据上传

AutoSTAT 提供了两种数据上传方式:

  1. 本地上传:点击上传按钮或直接拖动数据文件上传(适用于小于 200MB 的文件导入)

  2. 路径导入:输入具体的文件地址路径(适用于大文件导入)

上传成功后,您将看到数据展示和数据建议模块。

数据导入-数据上传

数据类型概览

在数据展示模块,您可以查看数据类型概览:

数据类型概览

数据预览

在数据预览界面中,您可以查看数据行并执行随机抽样操作。

随机抽样结果仅用于辅助用户观察数据分布特征,不会保存或用于后续分析步骤。

数据预览

数据建议

在数据建议模块中,用户可通过点击按钮或自然语言交互的方式,自动生成数据集的整体描述及各列含义分析。

数据导入-数据建议

备注

每次分析耗时会随数据集规模的增大而相应增加。

完成数据导入后,您可以根据需求,选择后续操作。