0
\ begingroup美元

假设我有一个主要数据集,它的次要数据集有数百个需要匹配和分组,就像一对多关系一样。

我是人工智能的新手,但我的问题是,很多子组包含相同的元素,甚至是不同的组合,以产生父数据,但在这种情况下,要避免重复,更多的是获得这些重复,并以某种方式将数据相加。

这是一个二级数据的例子,以及我想从分组中得到什么。

父数据

ID FIELD1 FIELD2 FIELD3 FIELD4 FIELD5 90148001 BLABLA 40 0 35896.89479 35896.89479

子数据

ID FIELD1 FIELD2 FIELD3 FIELD4 FIELD5 * 90148001鼓励性1 1770 1769.572665 - 1769.572665 * 90148001 DESCRIPTION2 1 13146 13146.45284 - 13146.45284 * 90148001鼓励性1 2176 2176.435074 - 2176.435074 * 90148001鼓励性1 2306 2305.716285 - 2305.716285 * 90148001鼓励性1 2531 2531.271196 - 2531.271196 * 90148001鼓励性1 1147 1146.803622 - 1146.803622 * 90148001鼓励性1 1991 1990.613246 - 1990.613246 * 90148001鼓励性1 3641 3641.394446 - 3641.394446 * 90148001鼓励性1 2471 2470.8253 - 2470.8253 * 90148001鼓励性1 2247 2246.984815 2246.984815 * 90148001

神经网络能够处理、聚集和分组这些数量吗?

| 改善这个问题 | |
\ endgroup美元
  • \ begingroup美元 你是在说聚类一般来说呢?你能更精确地解释一下神经网络应该如何“处理、聚合和分组”吗? \ endgroup美元- - - - - -nbro 9月14日10:15
  • \ begingroup美元 @nbro是的,我的意思是,k - means算法,而是被应用于图像分类或处理,它可以用来和组和子数据导致父数据,因为这是比较子数据匹配父数据和加起来和组 \ endgroup美元- - - - - -victcdva 9月14日14:23
  • \ begingroup美元 有些事我还是不清楚。为什么不直接混合“子数据”来获得“父数据”呢?您的问题是许多“子组”包含相同的元素,所以您希望避免重复吗?现在还不清楚为什么需要集群,因为您使用集群来分割数据,而不是对其进行分组。 \ endgroup美元- - - - - -nbro 9月14日14:56
  • \ begingroup美元 @nbro是的,对不起如果我不清楚,我的在这个世界上人工智能等等但是我的问题是,许多孩子组包含相同的元素,甚至不同的组合结果父数据但在这种情况下,以避免重复得到复制,添加了数据。 \ endgroup美元- - - - - -victcdva 9月14日15:08
  • \ begingroup美元 请,编辑你的文章包括这些细节。我认为您提供一个示例,说明子数据可能是什么样子,以及您希望通过分组来获得什么,这是很重要的。 \ endgroup美元- - - - - -nbro 9月14日15:10

你的答案

点击“发布您的答案”,即表示您同意我们的服务条款,隐私政策饼干的政策

浏览其他已标记的问题必威英雄联盟必威电竞问你自己的问题