مقدمه
یک پروژه ساده هوش مصنوعی در زبان پایتون که با استفاده از الگوریتمهای یادگیری ماشین پیادهسازی شده، میتواند پروژه پیشبینی قیمت خودرو باشد. در این پروژه، با استفاده از دادههایی که شامل مشخصات فنی و ویژگیهای خودروهاست، میتوانید قیمت خودرو را پیشبینی کنید.
برای پیادهسازی این پروژه، ابتدا باید دادههای مورد نیاز را جمعآوری و آنها را پیشپردازش کنید. پس از آن، دادهها را به دو دسته تقسیم میکنید: دادههای آموزش و دادههای تست. سپس با استفاده از الگوریتمهای یادگیری ماشین مانند الگوریتمهای درخت تصمیم و کلاسهای بردار پشتیبان، مدل پیشبینی را برای پیشبینی قیمت خودرو آموزش میدهید.
برای این پروژه، میتوانید از دادههای موجود در سایت Kaggle استفاده کنید. این دادهها شامل اطلاعاتی درباره مشخصات فنی و ویژگیهای خودروها، شامل برند، مدل، سال تولید، وضعیت فنی و قیمت خودروهای استفاده شده و جدید هستند. در ادامه، کد پروژه برای شما آورده شده است.
وارد کردن کتابخانههای مورد نیاز:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeRegressor
from sklearn.metrics import mean_absolute_error
وارد کردن دیتاست مورد نظر:
car_data = pd.read_csv('car_data.csv')
پیشپردازش دیتاست (حذف مواردی که دارای مقدار null هستند):
car_data = car_data.dropna()
تبدیل دادههای دستهای به دادههای عددی (one-hot encoding):
car_data = pd.get_dummies(car_data, columns=['brand', 'model', 'transmission', 'fuelType'])
تقسیم دیتاست به دو بخش: دیتاست آموزشی و دیتاست تست:
X = car_data.drop(['price'], axis=1)
y = car_data['price']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
آموزش مدل پیشبینی:
model = DecisionTreeRegressor()
model.fit(X_train, y_train)
ارزیابی مدل با استفاده از دیتاست تست:
y_pred = model.predict(X_test)
mae = mean_absolute_error(y_test, y_pred)
print('Mean Absolute Error:', mae)
کد کامل پایتونی این برنامه
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeRegressor
from sklearn.metrics import mean_absolute_error
# Load dataset
car_data = pd.read_csv('car_data.csv')
# Preprocessing
car_data = car_data.dropna()
car_data = pd.get_dummies(car_data, columns=['brand', 'model', 'transmission', 'fuelType'])
# Split dataset
X = car_data.drop(['price'], axis=1)
y = car_data['price']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# Train model
model = DecisionTreeRegressor()
model.fit(X_train, y_train)
# Predict on test dataset
y_pred = model.predict(X_test)
mae = mean_absolute_error(y_test, y_pred)
# Print mean absolute error
print('Mean Absolute Error:', mae)
برای نوشتن دیدگاه باید وارد بشوید.