k-means — все вопросы

1ответ
4 голоса
K-означает использование только определенных столбцов dataframe с scikit-learn
Я использую алгоритм k-means из scikit-learn и значения, которые я хочу кластеризовать, находятся в фрейме данных pandas с 3 столбцами: ID, value_1 и value_2. Я хочу объединить информацию, исполь
4ответа
4 голоса
Интерпретация выходных данных от mahout clusterdumper
Я провел тест кластеризации на просканированных страницах (более 25 тыс. документов; набор личных данных). Я сделал clusterdump: $MAHOUT_HOME/bin/mahout clusterdump --seqFileDir output/clusters-1/
3ответа
4 голоса
К-среднее с эллипсоидами
У меня есть n точек в R ^ 3, которые я хочу покрыть k эллипсоидами или цилиндрами (мне все равно, что проще). Я хочу примерно минимизировать объединение томов. Скажем, n - это десятки тысяч, а k - н
1ответ
4 голоса
Назначьте дескрипторы центрам кластеров после создания кластеров с помощью VLFeat
Я кластеризую свои данные с помощью k-средних, но я не использую стандартный алгоритм, я использую алгоритм приближенных ближайших соседей (ANN) для ускорения сравнений выборки с центром. Это можно
2ответа
4 голоса
Кластеризация K-центров с использованием R
Я не могу найти простую библиотечную функцию для кластеризации k-центров с использованием R, тогда как я не могу найти для k-средних (kmeans() ) и иерархическая кластеризация (hclust()). Существу
2ответа
4 голоса
Python - кластеризация с помощью K-средних. Некоторые столбцы с нулевой дисперсией
У меня есть набор данных, состоящий из ~ 200 99x20 массивов частот, каждый столбец суммируется в единицу. Я построил их с использованием тепловых карт, таких как . Каждый массив довольно разреженный
3ответа
4 голоса
k-значит начальные центры определяют результат?
K-означает кластеризацию является распространенным способом кластеризации. Предположим, что есть N точек для кластеризации K-средних, то есть N точек должны быть разделены на K групп, где точки в ка
2ответа
4 голоса
R k-означает алгоритм пользовательских центров
У меня есть двумерный набор данных, импортированный в координатах R - (x,y). Я хочу выполнить кластеризацию k-средних на этом наборе данных, но я бы хотел установить конкретные координаты в качестве
3ответа
4 голоса
Как сохранить результаты кластеризации Accord.Net K-Means для повторного использования?
Я пытаюсь сохранить результаты кластеризации Accord.Net K-Means, чтобы мне не пришлось пересчитывать каждый раз при запуске моей программы. Я также хочу назначить постоянные удобочитаемые метки д
3ответа
4 голоса
K-означает кластеризацию в Python
import numpy as np import matplotlib.pyplot as plt from sklearn.cluster import KMeans x = [916,684,613,612,593,552,487,484,475,474,438,431,421,418,409,391,389,388, 380,374,371,369,357,356,340,3
1ответ
4 голоса
Что такое «семя» в кластере WeK SimpleKMeans?
Я использую кластер WeK SimpleKMeans для набора данных. Но я не уверен, что такое начальное значение, что оно делает или как оно влияет на данные. то есть. Как большее или меньшее начальное зн
2ответа
4 голоса
Как вы можете сравнить две кластерные группы с точки зрения сходства или совпадения в Python?
Упрощенный пример того, что я пытаюсь сделать:Допустим, у меня есть 3 точки данных A, B и C. Я запускаю кластеризацию KMeans на этих данных и получаю 2 кластера ---- +: = 0 =: + ---- .Затем я запускаю
1ответ
4 голоса
Как визуализировать кластеризацию kmeans на многомерных данных
Я использую алгоритм кластеризации kmeans в наборе данных mnist и хочу визуализировать графики после кластеризации.Пока я сделал этоИтак, теперь у меня есть 10 кластеров, представляющих от 0 до 9. Как
1ответ
4 голоса
k-означает, что в Matlab недостаточно памяти в зависимости от функции расстояния?
Я использую K-средства с Matlab на большой и разреженной матрице ~ (1000000x1000).Теперь вот проблема - используя косинусное сходство в качестве функции расстояния, я получаю сообщение «Недостаточно п
2ответа
4 голоса
Нужно ли неравенство треугольника для kmeans?
Интересно, нужно ли неравенство треугольника для измерения расстояния, используемого в kmeans?
4ответа
4 голоса
Относительно качества различных алгоритмов k-средних
Я вижу, что для k-средних у нас есть алгоритм Ллойда, алгоритм Элкана, и у нас также есть иерархическая версия k-средних.Я вижу, что для всех этих алгоритмов алгоритм Элкана может повысить скорость.Но
1ответ
4 голоса
Пример кода OpenCV для квантования не работает
Я запускаю пример кода квантования, найденный в документации OpenCV , и он выбрасываетВот сам код:Любая помощь будет принята с благодарностью!
2ответа
4 голоса
Scikit-learn, KMeans: как использовать max_iter
Я хотел бы понять параметр max_iter из класса sklearn.cluster.KMeans .Согласно документации:Но, по моему мнению, если у меня есть 100 объектов, код должен запускаться 100 раз, если у меня есть 10.000
1ответ
4 голоса
Несовместимые результаты с KMeans между Apache Spark и scikit_learn
Я выполняю кластеризацию на наборе данных, используя PySpark.Чтобы найти число кластеров, я выполнил кластеризацию по диапазону значений (2,20) и нашел значения ---- +: = 0 =: + ---- (сумма квадратов
2ответа
4 голоса
Большинство взаимно удаленных k элементов (кластеризация?)
У меня есть простой вопрос машинного обучения:У меня есть n (~ 110) элементов и матрица всех парных расстояний.Я хотел бы выбрать 10 элементов, которые наиболее далеко друг от друга.То есть я хочуМоя
1 2

Популярные теги

security × 330linux × 316macos × 2827 × 268performance × 244command-line × 241sql-server × 235joomla-3.x × 222java × 189c++ × 186windows × 180cisco × 168bash × 158c# × 142gmail × 139arduino-uno × 139javascript × 134ssh × 133seo × 132mysql × 132