BUILDING LIFE CYCLE MANAGEMENT AT THE OPERATION STAGE USING ARTIFICIAL NEURAL NETWORK MODELS AND MACHINE LEARNING
Abstract and keywords
Abstract (English):
The use of artificial neural networks and machine learning methods for the analysis of heat loss in buildings is of significant relevance in modern construction. These technologies are highly accurate and efficient in data processing. Artificial neural networks have the ability to analyze vast amounts of information and identify complex patterns, which significantly increases the accuracy of determining heat loss in buildings. In turn, machine learning methods make it possible to take into account various influencing factors, such as geographic location and meteorological conditions, thereby making a significant contribution to improving the quality of analytical results. Such approaches provide more reliable and accurate conclusions, which is critical for effective energy management and reducing heat loss in buildings. In this article, the authors conducted a study of heat losses of buildings and their prediction at the operational stage using artificial neural networks and machine learning methods. The technique is based on the analysis of data on heat loss and their relationship with various building parameters. Forecasting was carried out using artificial neural networks in the Statistica software package and the machine learning method based on the scikit-learn library. The proposed approach allows you to effectively manage the energy consumption of a building, optimizing its energy efficiency and improving the life cycle management of a capital construction project. The results demonstrate the high accuracy and convergence of the model with actual values, as well as its ability to predict performance.

Keywords:
data analysis, artificial neural networks, energy consumption optimization, forecasting, heat losses, life cycle management
Text
Publication text (PDF): Read Download

Введение. В современном строительстве управление жизненным циклом зданий становится ключевым аспектом, особенно в контексте энергоэффективности. Прогнозирование тепловых потерь на этапе эксплуатации зданий играет важную роль в оптимизации этого управления, что требует не только точного прогнозирования эффективности, но и использования передовых технологий, включая искусственные нейронные сети (ИНС).

Кладка стен из ячеистобетонных блоков представляет собой эффективный метод строительства наружных стен зданий в современной практике архитектуры и строительства. Отличительные черты данного материала, такие как высокие теплофизические характеристики и механическая прочность, открывают перед ним широкие перспективы применения [1-4].

Использование блоков из ячеистого бетона способствует повышению энергоэффективности зданий. Благодаря своей структуре, они обеспечивают высокий уровень теплоизоляции, что позволяет уменьшить теплопотери через стены и снизить энергозатраты на отопление и кондиционирование помещений. Это одно из ключевых преимуществ, которое делает газобетон востребованным материалом для создания энергоэффективных зданий [5, 6].

Кроме того, блоки из ячеистого бетона отличаются долговечностью и надежностью. Их устойчивость к воздействию различных факторов, таких как влажность, температурные колебания и механические нагрузки, гарантирует длительный срок службы здания, обеспечивая его стабильность и сохранность конструкции на протяжении многих лет эксплуатации [7].

Современные исследования в области строительства активно используют передовые методы анализа для прогнозирования тепловых потерь через стены из газобетона. ИНС становятся важным инструментом в этом процессе, позволяя улучшить точность прогнозов за счет уникальных характеристик и теплоизоляционных свойств этого строительного материала. Такие современные подходы в анализе данных способствуют оптимизации энергетической эффективности зданий, построенных из газобетона.

В вариационном ряде выделяют две основные категории признаков: средние значения и меры вариации (или рассеяния) [8-10]. Среднее арифметическое представляет собой количественную характеристику однородной группы данных, определяя обобщенные размеры количественных признаков. Основными показателями средних значений являются среднее арифметическое, мода и медиана.

Среднее арифметическое (x) вычисляется по формуле:

x= i=1nxin ,  (1)

где xi – значения признака с порядковым номером i (i = 1, n); n – объем данных.

Мода (Mo) – это значение, которое наиболее часто встречается в наборе данных. Медиана (Me) представляет собой значение, расположенное посередине вариационного ряда. Для нечетного числа вариантов (n = 2m + 1) это значение будет таким: xm+1, для четного (n = 2m) – среднее между xm и xm+1.

Медиана широко применяется при анализе неравномерных распределений данных и менее чувствительна к выбросам по сравнению с средним арифметическим. Это делает ее более достоверной мерой центральной тенденции в данных, особенно в случае ассиметричных распределений.

Хотя средние значения дают общую картину о статистической группе, они не отражают, насколько точно они описывают это собрание данных.

Для измерения вариации значений признака используются другие показатели: размах вариации, дисперсия и среднеквадратичное отклонение.

Размах вариации (R) определяется как разница между максимальным (xmax) и минимальным (xmin) значениями признак апо формуле:

R = xmax xmin,  (2)

Другие метрики, такие как дисперсия (σ2) и среднеквадратичное отклонение (σ) вычисляются на основе отклонений всех значений признака от его среднего значения. Дисперсия измеряет абсолютный разброс значений относительно среднего значения, представляя средний квадрат отклонений. Среднеквадратичное отклонение выражает меру вариации в тех же единицах, что и сам признак, и представляет собой корень из дисперсии

σ=i=1nxi+x2n ,  (3)

где xi – варианта с порядковым номером i; x  – средняя арифметическая; n – объем совокупности.

При сравнении вариации признака между группами объектов или внутри одной группы в разные периоды, полезны относительные показатели, такие как коэффициент вариации. Он представляет отношение среднеквадратического отклонения к средней арифметической, выраженное в процентах:

V=σx100% .  (4)

Форма распределения данных, соответствующая нормальному распределению, определяется двумя параметрами: средним значением x и стандартным отклонением σ. Уравнение, описывающее кривую нормального распределения, представлено следующим образом:

y=e-t222π , (5)

где t – нормализованное отклонение данных от среднего значения.

Основное свойство кривой нормального распределения заключается в том, что расстояние на горизонтальной оси распределения, измеренное в единицах стандартного отклонения от среднего значения, всегда остается постоянным. Это позволяет оценить долю данных в генеральной совокупности с соответствующими параметрами (рис. 1) [8].

Также в качестве инструмента для анализа для прогнозирования тепловых потерь через стены из газобетона возможно использование модели машинного обучения, например, на основе библиотеки scikit-learn, как наиболее доступная для использования и вариации исходных факторов. Scikit-learn – это библиотека машинного обучения для языка программирования Python. Модель машинного обучения, использующая библиотеку scikit-learn, проходит через несколько ключевых этапов. Первым шагом является выбор подходящей модели, что зависит от конкретного типа задачи, будь то классификация или регрессия, а также от особенностей данных. Scikit-learn предоставляет широкий спектр алгоритмов, включая Support Vector Machines, Random Forest, Decision Trees и другие [11-13].

Второй этап – подготовка данных. В этом контексте необходимо обеспечить, чтобы данные были представлены в формате, наиболее подходящем для обучения модели. Это может включать в себя масштабирование, кодирование категориальных переменных и обработку пропущенных значений.

 

Рис. 1. Вид кривой нормального распределения

 

После этого происходит обучение модели на тренировочных данных. С использованием методов, предоставляемых scikit-learn, модель приспосабливается к данным и настраивает свои параметры.

Затем модель тестируется на отложенных тестовых данных для оценки ее производительности и обобщающей способности. В случае необходимости можно произвести настройку гиперпараметров для улучшения результатов [14, 15]. Наконец, обученная модель готова к использованию для прогнозирования или классификации новых данных в соответствии с задачей, для которой она была разработана.

Материалы и методы.

В рамках исследования проведено прогнозирование тепловых потерь здания с наружными стенами из газобетонных блоков площадью 18 м2 с использованием ИНС для г. Белгород (Россия). Прогнозирование осуществлялось с использованием ИНС в программном комплексе Statistica. В качестве исходных данных были приняты следующие показатели: теплопроводность конструкции – 0,141 Вт/(м∙°С); приведенное сопротивление теплопередаче конструкции – 1,897 (м∙°С)/Вт; толщина стены – 300 мм; ориентация конструкции – северная. Тепловые потери через ограждающие конструкции определяются исходя из температуры наружного воздуха (рис. 2) по формуле:

Q=kATвн-Tнарd ,  (6)

где Q – количество тепла, проходящего через стену за определенное время, Вт; k – коэффициент теплопроводности материала стены, Вт/(м2∙°С); A – площадь стены, м2; Твн – температура внутренней поверхности стены, °С; Тнар – температура внутренней поверхности стены, °С; d – толщина стены.

 

 

Рис. 2. Температура наружного воздуха в г. Белгород (2022 г.)

 

В качестве модели машинного обучения использовалась модель на основе библиотеки scikit-learn, элементы которой представлены в табл. 1.

Основная часть.

При обучении ИНС использовался метод многократных подвыборок с 5 нейронными сетями при построении (рис. 3, а). Число нейронов на внутреннем слое сети было принято от 10 до 25 (табл. 2), циклов построения – 2 000 (рис. 3, б).

 

 

 

Таблица 1

Элементы модели машинного обучения на основе библиотеки scikit-learn

Назначение

Элемент модели

 

from sklearn.model_selection import train_test_split

from sklearn.linear_model import LinearRegression

from sklearn.metrics import mean_squared_error

import pandas as pd

Загрузка данных из отдельных файлов CSV для каждого показателя

    'Теплопроводность_конструкции': 'путь_к_файлу_теплопроводность.csv',

    'Приведенное_сопротивление_теплопередаче': 'путь_к_файлу_сопротивление.csv',

    'Теплопотери_через_ограждающие_конструкции': 'путь_к_файлу_теплопотери.csv',

    'Дополнительные_удельные_потери_теплоты_через_стык_j-го_вида': 'путь_к_файлу_потери_через_стык.csv',

    'Ориентация_конструкции': 'путь_к_файлу_ориентация.csv',

    'Температура_воздуха': 'путь_к_файлу_температура.csv',

    'Относительная_влажность': 'путь_к_файлу_влажность.csv',

Замена названия ключей на фактические названия показателей

file_paths = {

}

 

Считывание данных из каждого файла CSV

data = {}

for key, file_path in file_paths.items():

    data[key] = pd.read_csv(file_path)

Объединение данных в один DataFrame по общему идентификатору

merged_data = data['Теплопроводность_конструкции']

for key in file_paths.keys():

    if key != 'Теплопроводность_конструкции':

        merged_data = pd.merge(merged_data, data[key], on='ID')

Разделение на признаки и целевую переменную

X = merged_data.drop('Тепловые_потери_через_ограждающие_конструкции', axis=1)

y = merged_data['Тепловые_потери_через_ограждающие_конструкции']

Создание обучающего и тестового наборов данных

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

Создание и обучение модели линейной регрессии

model = LinearRegression()

model.fit(X_train, y_train)

Предсказание на тестовом наборе данных

y_pred = model.predict(X_test)

Оценка качества модели

mse = mean_squared_error(y_test, y_pred)

print(f"Среднеквадратичная ошибка: {mse}")

Использование модели для прогнозирования тепловых потерь для новых данных

new_data = {

     новый набор данных

}

 

 

new_df = pd.DataFrame(new_data)

predicted_heat_losses = model.predict(new_df)

print(f"Прогноз тепловых потерь для конструкции: {predicted_heat_losses[0]}")

 

Рис. 3. Создание подвыборок: а – задание количества нейронных сетей при построении; б – задание количества циклов построения

Таблица 2

Результаты обучения нейронных сетей

Индекс

Имя

Ошибка на тренировке

Ошибка на тесте

Ошибка на валидации

1

MLP 168-25-1

0,975309

0,939692

0,916330

2

MLP 168-25-1

0,974771

0,909163

0,917442

3

MLP 168-25-1

0,992309

0,896421

0,849101

4

MLP 168-25-1

0,967524

0,910456

0,920615

5

MLP 168-25-1

0,976584

0,919458

0,870481

6

MLP 168-20-1

0,954770

0,938841

0,919451

7

MLP 168-20-1

0,977932

0,904333

0,907534

8

MLP 168-20-1

0,988593

0,896304

0,883655

9

MLP 168-20-1

0,981821

0,906755

0,903165

10

MLP 168-20-1

0,979376

0,930609

0,879652

11

MLP 168-15-1

0,960189

0,935911

0,921713

12

MLP 168-15-1

0,976658

0,906108

0,913985

13

MLP 168-15-1

0,990239

0,897884

0,879350

14

MLP 168-15-1

0,969767

0,911645

0,916526

15

MLP 168-15-1

0,979235

0,925683

0,894693

16

MLP 168-10-1

0,950672

0,940617

0,914498

17

MLP 168-10-1

0,936904

0,902839

0,908218

18

MLP 168-10-1

0,988885

0,898756

0,875421

19

MLP 168-10-1

0,980602

0,906507

0,923584

20

MLP 168-10-1

0,978299

0,915976

0,860043

 

Анализируя ошибки и производительности на выборках для полученного набора сетей (табл. 2), делаем вывод, что из всей выборки на тесте для города Белгорода наиболее оптимальной является сеть 13 с 15 нейронами на внутреннем слое сети с наименьшей ошибкой на тренировке (0,990) и на тесте (0,897).

Правильность выбора данных сетей подтверждается высокой сходимостью с фактическими значениями на графике прогнозов временных рядов для данной сети как с выборкой тренировки, теста, валидации (рис. 4), где синим цветом – фактические значения, красным – данные, прогнозируемые сетью.

 

 

Рис. 4. График прогнозов временных рядов для сети с выборкой тренировки, теста и валидации

 

Гистограмма остатков (рис. 5) соответствует нормальному закону распределения Гаусса – Лапласа с пиком в центре и относительно симметричными боковыми сторонами (рис. 1).

Фактическая функция соответствует прогнозной, что подтверждается высокой плотностью точек на прямой (рис. 6). Полученная регрессионная модель допускает ошибку около 1,22%.

Результат обучения модели машинного обучения представлен на рис. 7. После применения модели машинного обучения получено низкое значение среднеквадратичной ошибки (до 1,8), что указывает на высокую точность модели в предсказании энергоэффективности конструкций.

 

Рис. 5. Гистограмма остатков временного ряда с выборкой тренировки, теста и валидации

 

Рис. 6. Диаграмма рассеяния для сети с выборкой тренировки, теста и валидации

 

Рис. 7. График предсказания модели машинного обучения и ИНС для данных по г. Белгород:  – расчетные значения;  – прогноз ИНС;  – прогноз машинного обучения

 

Кроме того, результаты предсказаний логически сходятся с известными факторами влияния на энергоэффективность, такими как климатические условия и другие показатели, что также подтверждается большой сходимостью результатов с нейросетевым прогнозированием.

Выводы. Таким образом, исследования показали, что использование нейросетевых моделей способствует улучшению точности прогнозов и оптимизации энергетической эффективности зданий, возведенных из газобетонных материалов. Использование ИНС позволяет более точно предсказывать тепловые потери через такие стены, что существенно важно для улучшения управления энергопотреблением зданий в различных климатических условиях.

Нейросетевые технологии демонстрируют свою эффективность не только в обеспечении точности прогнозов, но и в способности адаптироваться к изменяющимся условиям и динамике процессов. Этот подход не только содействует оперативному управлению ресурсами и оборудованием, но и обеспечивает более долгосрочное и устойчивое функционирование объектов. Таким образом, внедрение и использование искусственных нейронных сетей в прогнозировании на стадии эксплуатации становится ключевым аспектом повышения эффективности инженерного управления в области капитального строительства.

Использование модели машинного обучения на основе библиотеки scikit-learn для определения теплопотерь здания представляет высокую актуальность в свете нескольких существенных преимуществ этого подхода. Прежде всего, модели, построенные с использованием данной библиотеки, обладают высокой точностью и способностью обобщения, что особенно ценно в контексте сложных взаимосвязей и закономерностей, характерных для анализа теплопотерь зданий.

Таким образом, использование модели машинного обучения на основе scikit-learn выгодно благодаря ее точности, гибкости в выборе моделей и эффективности обработки данных, что подтверждается высокой сходимостью данных с расчетными показателями.

В заключение следует подчеркнуть, что использование ИНС на стадии эксплуатации объекта капитального строительства открывает новые возможности для управления жизненным циклом проекта. Нейросетевые технологии и модели машинного обучения позволяют спрогнозировать результаты организационно-технологических и конструктивных решений, предпринятых на стадии проектирования и возведения, уменьшая вероятность человеческих ошибок и оптимизируя использование ресурсов. Эксплуатация объектов капитального строительства с применением искусственных нейронных сетей и методов машинного обучения становится ключевым фактором в повышении конкурентоспособности проектов и обеспечении их успешного функционирования в долгосрочной перспективе.

References

1. Grinfeld G.I. Performance Characteristics of Autoclaved Aerated Concrete with Density 400 kg/cub.m. Construction of Unique Buildings and Structures. 2013. No. 5(10). Pp. 28-57.

2. Suleymanova L.A., Pogorelova I.A., Kondrashev K.R., Suleymanov K.A., Piriev Yu.S. Energy-saving aerated concrete with composite binders [Energosberegayushchie gazobetony na kompozicionnyh vyazhushchih]. Bulletin of BSTU named after. V.G. Shukhov. 2016. No. 4. Pp. 73-83. (rus)

3. Suleymanova L.A. Control of the process of formation of the porous structure of cellular concrete [Upravlenie processom formirovaniya poristoj struktury yacheistyh betonov]. Bulletin of BSTU named after. V.G. Shukhov. 2016. No. 2. Pp. 69-76. (rus)

4. Peng P.F., Qin X.M., Wu Y.S. Performance Study on Masonries of Different Aerated Concrete Blocks. Key Engineering Materials. 2014. No. 633. Pp. 299-302. DOI:https://doi.org/10.4028/www.scientific.net/KEM.633.299

5. Harmati N., Jakšić Ž., Vatin N. Energy consumption modeling via heat balance method for energy performance of a building. In: Procedia Engineering. 2015. Pp. 786-794. DOI:https://doi.org/10.1016/j.proeng.2015.08.238

6. Stritih U. Heat Transfer Enhancement in Latent Heat Thermal Storage System for Buildings. Energy and Buildings. 2003. No. 35(11). Pp. 1097-1104. DOI:https://doi.org/10.1016/j.enbuild.2003.07.001

7. Girault M., Petit D. Identification methods in nonlinear heat conduction. Part II: inverse problem using a reduced model. Int. Journal of Heat and Mass. 2005. No. 48(1). Pp. 119-133. DOI:https://doi.org/10.1016/j.ijheatmasstransfer.2004.06.033

8. Bogdanova R.A., Kazazaeva P.I. Primary assessment of statistical data in the STATISTICA program [Pervichnaya ocenka statisticheskih dannyh v programme STATISTICA]. Information and education: boundaries of communications. 2022. No. 14(22). Pp. 157-162. (rus)

9. Kamashev V.V., Kucherova E.A., Raskin P.N. Selection of optimal settings for a neural network when forecasting a time series in the statistics package [Vybor optimal'nyh nastroek nejronnoj seti pri prognozirovanii vremennogo ryada v pakete statistika]. Youth. The science. Modernity: IV All-Russian scientific and practical conference with international participation, Votkinsk. 2017. Pp. 107-109. (rus)

10. Klenina V.I. Sofinskaya E.N., Ziroyan A.A. Time series analysis and forecasting using the example of a program [Analiz vremennyh ryadov i prognozirovanie na primere programmy]. Human capital. 2015. No. 2(74). Pp. 66-74.

11. Deo T.Y., Sanju A. Data imputation and comparison of custom ensemble models with existing libraries like XGBoost, CATBoost, AdaBoost and Scikit learn for predictive equipment failure. Materials Today: Proceedings. 2023. Vol. 72(3). Pp. 1596-1604. DOI:https://doi.org/10.1016/j.matpr.2022.09.410.

12. Qu C., Houston P.L., Yu Q., Pandey P., Conte R., Nandi A., Bowman J.M. Machine learning software to learn negligible elements of the Hamiltonian matrix. Artificial Intelligence Chemistry. 2023. Vol. 1(2). 100025. DOI:https://doi.org/10.1016/j.aichem.2023.100025.

13. Qu C., Houston, P.L., Yu Q., Conte, R., Pandey P., Nandi A., Bowman J.M. Machine learning classification can significantly reduce the cost of calculating the Hamiltonian matrix in CI calculations. The Journal of Chemical Physics. 2023. 159(7). 1. DOI:https://doi.org/10.1063/5.0168590

14. Hastie T., Tibshirani R., Friedman J.H. The elements of statistical learning: data mining, inference, and prediction. Springer Series in Statistics: Springer New York. 2009. Vol. 2. 758 p.DOI:https://doi.org/10.1007/BF02985802.

15. Ma Sh., He B., Ge X., Luo X. Spatial prediction of soil salinity based on the Google Earth Engine platform with multitemporal synthetic remote sensing images. Ecological Informatics. 2023. Vol. 75. 102111. DOI:https://doi.org/10.1016/j.ecoinf.2023.102111.


Login or Create
* Forgot password?