Du er ikke logget ind
Beskrivelse
Дисбаланс классов является одной из сложных проблем для методов интеллектуального анализа данных и машинного обучения. Данные в реальных приложениях часто имеют несбалансированное распределение по классам. Это происходит, когда большинство примеров принадлежит к классу большинства, а несколько примеров - к классу меньшинства. В этом случае стандартные классификаторы склонны относить все примеры к классу большинства и полностью игнорировать класс меньшинства. Для этой проблемы исследователями было предложено множество решений как на уровне данных, так и на уровне алгоритмов. Большинство работ сосредоточено на проблемах бинарного класса. Однако бинарный класс - не единственный сценарий, в котором возникает проблема дисбаланса классов. В случае многоклассовых наборов данных гораздо сложнее определить большинство и меньшинство классов. Поэтому многоклассовая классификация в несбалансированных наборах данных остается важной темой исследований. В нашей книге мы пред