Product line engineering derives product variants by selecting features. Understanding the correlation between feature selection and performance is important for stakeholders to acquire a desirable product variant. We infer such a correlation using four regression methods based on small samples of measured configurations, without additional effort to detect feature interactions. We conduct experiments on six real-world case studies to evaluate the prediction accuracy of the regression methods. A key finding in our empirical study is that one regression method, called Bagging, is identified as the best to make accurate and robust predictions.
Эмпирическое сравние регрессионных методов для предсказания производительности конфигурируемых систем
Software Product Line (SPL) разработка ПО позволяет получить различные варианты программного продукта путем выбора определенного набора функций, который продукт должен выполнять. Понимание взаимосвязи между выбором функций и производительностью важно для всех заинтересованных сторон, чтобы сформировать желаемый вариант продукта. Мы выводим такую корреляцию, используя четыре регрессионных метода и микро-данные, основанные на малых выборках измеренных конфигураций ПО, без дополнительных усилий по обнаружению взаимодействия между выбранными функциями. Мы проводим эксперименты на шести реальных кейсах, чтобы оценить точность предсказания методов регрессии. Ключевой вывод нашего эмпирического исследования заключается в том, что один из методов регрессии (бэггинг деревьев регрессии), признан лучшим для получения точных и надежных прогнозов.