دانلود پایان نامه

3.0 3.0;5.0 3.0 2.0;5.0 3.0 2.0;5.0 4.0 3.0;5.0 3.0 3.0;5.0 3.0 2.0;4.0 3.0 4.0;5.0 3.0 3.0;5.0 3.0 2.0;4.0 3.0 4.0;4.0 3.0 3.0;4.0 3.0 2.0;4.0 3.0 2.0;4.0 3.0 4.0;5.0 3.0 2.0;5.0 4.0 3.0;5.0 3.0 2.0;5.0 4.0 2.0;5.0 4.0 2.0;5.0 3.0 2.0;5.0 3.0 2.0;5.0 3.0 2.0;4.0 3.0 4.0;4.0 3.0 2.0;3.0 3.0 2.0;4.0 3.0 3.0;4.0 3.0 2.0;4.0 3.0 2.0;4.0 3.0 2.0;4.0 4.0 4.0;4.0 3.0 2.0;4.0 3.0 2.0;4.0 3.0 3.0;4.0 3.0 2.0;5.0 5.0 5.0;5.0 4.0 5.0;5.0 5.0 4.0;5.0 2.0 3.0;5.0 2.0 1.0;4.0 2.0 2.0;4.0 2.0 1.0;4.0 2.0 3.0;4.0 2.0 1.0;2.0 2.0 2.0;5.0 2.0 1.0;4.0 2.0 2.0;5.0 2.0 1.0;4.0 2.0 1.0;4.0 2.0 3.0;3.0 2.0 1.0;5.0 2.0 2.0;4.0 2.0 2.0;5.0 2.0 2.0;3.0 2.0 2.0;3.0 2.0 1.0;4.0 2.0 1.0;2.0 2.0 2.0;5.0 2.0 1.0;3.0 2.0 2.0;5.0 2.0 3.0;4.0 2.0 3.0;5.0 2.0 2.0;3.0 2.0 2.0;4.0 2.0 3.0;5.0 2.0 2.0;5.0 2.0 2.0;5.0 2.0 2.0;5.0 2.0 3.0;5.0 2.0 2.0;3.0 2.0 2.0;1.0 2.0 2.0;2.0 2.0 2.0;4.0 2.0 2.0;5.0 2.0 2.0;4.0 2.0 2.0;3.0 2.0 2.0;3.0 2.0 2.0;5.0 2.0 3.0;4.0 1.0 1.0;4.0 1.0 1.0;4.0 1.0 1.0;3.0 1.0 1.0;5.0 1.0 1.0;4.0 1.0 1.0;5.0 1.0 1.0;4.0 1.0 1.0;2.0 1.0 1.0;4.0 1.0 1.0;2.0 1.0 1.0;3.0 1.0 1.0;3.0 1.0 1.0;4.0 1.0 1.0;5.0 1.0 2.0;4.0 1.0 1.0;4.0 1.0 1.0;4.0 1.0 3.0;3.0 1.0 1.0;2.0 1.0 2.0];

c = [1.7 1.7 1.7;3.0 3.0 3.0;4.3 4.3 4.3];
B = 0;
while B 20
t = 0;
g = 0;
k = 0;
p = 0;
s = 0;
a = 0;
r = 0;
n = 0;
l = 0;
q = 0;
f = 0;
o = 0;

m = [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0];

for i = 1:101
for j = 1:3
D1(i,j) = ( x(i,1) – c(j,1) );
D2(i,j) = ( x(i,2) – c(j,2) );
D3(i,j) = ( x(i,3) – c(j,3) );
end
end
for i = 1:101
for j = 1:3
fprintf(‘Dis %d %d is: (%f,%f,%f)n’,i,j,D1(i,j),D2(i,j),D3(i,j));
end
end
for i = 1:101
for j = 1:3
dist(i,j)= sqrt((D1(i,j) ^ 2) + (D2(i,j) ^ 2) + (D3(i,j) ^ 2));
end
end
for i = 1:101
if (dist(i,1) dist(i,2) && dist(i,1) dist(i,3))
m(i) = 1;
else if (dist(i,2) dist(i,3))
m(i) = 2;
else m(i) = 3;
end
end
end
for i = 1:101
if (m(i) == 1)
t = x(i,1) + t;
r = x(i,2) + r;
q = x(i,3) + q;
p = p +1;
else if (m(i) == 2)
s = x(i,1) + s;
n = x(i,2) + n;
f = x(i,3) + f;
k = k +1;
else if (m(i) == 3)
a = x(i,1) + a;
l = x(i,2) + l;
o = x(i,3) + o;
g = g +1;
end
end
end
end
c(1,1) = t/p;
c(1,2) = r/p;
c(1,3) = q/p;
c(2,1) = s/k;
c(2,2) = n/k;
c(2,3) = f/k;
c(3,1) = a/g;
c(3,2) = l/g;
c(3,3) = o/g;
B = B + 1;
end
for i=1:101
fprintf(‘item %d is for cluster: %dn’,i,m(i));
end

fprintf(‘1st cluster center is:
%f,%f,%fn’,c(1,1),c(1,2),c(1,3));
fprintf(‘2nd cluster center is: %f,%f,%fn’,c(2,1),c(2,2),c(2,3));
fprintf(‘3th cluster center is: %f,%f,%fn’,c(3,1),c(3,2),c(3,3));

در پیاده سازی این دو الگوریتم تعداد تکرار مراحل تکراری الگوریتم را 20 بار تعیین کردم، زیرا پس از این تعداد تکرار دیگر مراکز خوشه ها تغییر چندانی پیدا نمی کردند. همچنین در الگوریتم K-Harmonic Means مقدار پارامتر P را 2 در نظر گرفتم.
پس از اینکه مشتریان را توسط هر دوی این الگوریتم ها خوشه بندی کردیم، به علت سخت بخشبندی1 بودن الگوریتم K-Means، قوانین استقرایی مربوط به هر خوشه، که از رفتار خرید پیشین مشتریان هر خوشه بدست می آید و رفتار خرید آتی مشتریان همان خوشه را پیش بینی می کند را از خوشه های منتج شده از K-Means بدست می آوریم.برای استخراج چنین قوانینی الگوریتم استقرایی که ساده ترین و معروفترین الگوریتم در این زمینه است را بکار می بریم.
برای استفاده از این الگوریتم بر روی خوشه های مشتریان باید دو مفهوم را مشخص و مقداردهی کرد.همانطور که در فصل قبل گفته شدقوانین استنتاجی که از خوشه ها استخراج می شوند بصورت اگر، آنگاه می باشند.مثلا اگر کالای A خریداری شود آنگاه به احتمال زیاد کالای B نیز خریداری می شود.
مفهوم حداقل درجه پشتیبانی طبق تعریفی که در فصل قبل انجام شد، برای قانون بالا، درصدی به معنای آن است که در رکوردهای پایگاه داده نسبت رکوردهایی که دارای A و B هستند به کل رکوردها، اگر از این درصد کمتر شود قانون معتبر نخواهد بود.
همچنین مفهوم حداقل درجه اطمینان طبق تعریفی که در فصل قبل انجام شد، برای قانون بالا، درصدی به معنای آن است که در رکوردهای پایگاه داده نسبت رکوردهایی که دارای A و B هستند به رکوردهایی که دارای A هستند، اگر از این درصد کمتر شود قانون معتبر نخواهد بود.
با توجه به تعداد کالاها و همچنین تکرار و بررسی درصدهای گوناگون و تعداد قوانینی که بدست می آمد به این نتیجه رسیدم که بهترین درصد برای کمینه پشتیبانی 10% و بهترین درصد برای کمینه اطمینان 60% می باشد.در نتیجه با استفاده از نرم افزار وکا1 3.7 که یکی از ابزارهای داده کاوی می باشد الگوریتم استقرایی با کمینه پشتیبانی 10% و کمینه اطمینان 60% برای هر یک از خوشه ها بکار برده شد.

3-5 رهیافتی برای شخصی سازی تبلیغات:
بعد از اینکه قوانین مربوط به رفتار خرید مشتریان در هر خوشه را استخراج کردیم باید رهیافتی را برای استفاده از این قوانین تعیین کنیم.ما این راه حل را در نظر گرفتیم که قوانین استخراج شده برای هر خوشه، علاوه بر اینکه برای هر مشتری متعلق به آن خوشه مورد استفاده قرار می گیرد، برای مشتریانی که این خوشه دومین خوشه آنها می باشد و درجه تعلقی بیش از 25% را نسبت به آن دارند نیز مورد استفاده قرار گیرد.
بدین صورت طبق قوانینی که بدست آوردیم برای هر مشتری به نسبت اولین کالایی که خرید می کند، تبلیغی مناسب به او ارائه می شود.قالب کاری سیستمی که برای این رهیافت در نظر گرفتیم همانطور که در شکل ( 3-2) مشاهده می شود بدین ترتیب است:

خیر خیر

بلی
بلی

شکل3-2: فلوچارت سیستم ارائه تبلیغ در سایت
ابتدا به احراز هویت مشتری می پردازیم و هر مشتری با نام کاربری و رمز عبور یکتایی که دارد وارد سایت شده و شناسایی می شود.همچنین با استفاده از پایگاه داده سایت و جدولی به نام مشتریان در آن خوشه اصلی و دومین خوشه ای که مشتری به آنها تعلق دارد مشخص می شود.پس از اولین خریدی که مشتری در سایت انجام می دهد، با توجه به کالایی که خریداری کرده است، جستجویی در سیستم صورت می گیرد بدین ترتیب که آیا قانونی در خوشه اصلی برای این کالا وجود دارد یا خیر.اگر قانونی وجود داشت، تبلیغ کالای مربوط به آن قانون به مشتری ارائه می گردد اما اگر قانونی وجود نداشته باشد آنگاه جستجو می شود که آیا قانون استخراج شده ای از خوشه دوم مشتری برای این کالا وجود دارد یا خیر.اگر قانونی وجود داشت، تبلیغ کالای مربوط به آن قانون ارائه می گردد اما اگر قانونی وجود نداشت تبلیغ کالایی به مشتری ارائه می گردد که بیشترین تعداد فروش را در بین اعضای خوشه اصلی مشتری دارد.

3-6 روش ارزیابی:
برای اینکه بتوانیم نشان دهیم که این مدل جدید تا چه اندازه مفید بوده است و برای اثبات اینکه این مدل می تواند جایگزین روش های قبلی شود باید به ارزیابی این مدل با روشی که قبل از آن بکار برده می شده است پرداخت.برای این کار تعداد دفعاتی که تبلیغ یک کالا به مشتری ارائه می شود و همچنین تعداد دفعاتی که کالای پیشنهاد شده مورد خرید مشتری قرار می گیرد را ثبت می کنیم.
تعداد دفعات خرید کالای پیشنهاد شده نسبت به تعداد دفعات پیشنهاد شدن این کالا درصد موفقیت تبلیغ این کالا را نشان می دهد و در حالت کلی میانگین درصد موفقیت تبلیغ تمام کالاها نشان دهنده موفقیت کلی این مدل در ارائه تبلیغات بر حسب علایق مشتری می باشد.ضمنا برای اینکه نشان دهیم خوشه بندی K-Harmonic Means و بکارگیری قوانین خوشه دوم تا چه اندازه مفید واقع شده است تعداد دفعات پیشنهاد شدن کالا بر طبق قوانین مربوط به خوشه دوم هر مشتری و همچنین تعداد دفعات مورد خرید قرار گرفتن این کالاهای پیشنهاد شده از قوانین خوشه دوم را حساب می کنیم و بعد از آن می توان نسبت موفقیت این قوانین را بدست آورد و با نسبت موفقیت کل این مدل مقایسه کرد.برای ثبت تعداد پیشنهادهای ارائه شده و تعداد پیشنهادهای خریداری شده، در برنامه نویسی سایت این امکان را بوجود آوردیم که بعد از هر پیشنهاد و بعد از هر خریداری پیشنهاد، مقدار فیلد مربوط به آنها در جدول خرید پایگاه داده 1 عدد اضافه شود.

فصل چهارم :
محاسبات و یافته های تحقیق

در این فصل تجربه های عملی و نتایجی که از بکارگیری مدل بدست آوردیم را بصورت مرحله به مرحله شرح می دهیم و همچنین نتایج ارزیابی و مقایسه مدل با روش قبلی را توصیف می کنیم.

4-1 : پایگاه داده هدف
ما در این تحقیق از یک پایگاه داده اکسس1 استفاده کرده ایم که دارای 3 جدول مشتریان، محصولات و خرید است که عملیات خوشه بندی بر روی اطلاعاتی که از جدول خرید بدست می آید، انجام می شود.همچنین عملیات مربوط به استخراج قوانین وابستگی بر روی همین جدول خرید انجام می گیرد.این جدول دارای 5 فیلد می باشد.فیلدهای شماره خرید، شماره مشتری، شماره کالا، قیمت کالا وتاریخ خرید در این جدول وجود دارند. در جدول محصولات نیز دو فیلد شماره کالا و قیمت کالا وجود دارند که پس از اینکه مدل جدیدمان را به کار گرفتیم دو فیلد ارائه کالا و قبول کالا را برای ارزیابی و تعیین میزان موفقیت مدل در ارائه تبلیغات مناسب اضافه می کنیم. همچنین دو فیلد ارائه کالای خوشه دوم و قبول کالای خوشه دوم را برای ارزیابی و تعیین میزان موفقیت طرح استفاده از قوانین دومین خوشه مشتری اضافه می کنیم.

4-2 : آماده سازی مجموعه داده
همانطور که در فصل قبل ذکر شد، در این تحقیق داده های مشتریانی که بیش از یک مرتبه از سایت خرید کرده اند مهم می باشد.زیرا از تک تراکنش ها نمی توان هیچ قانون وابستگی را استخراج کرد.بنابر این رکوردهای خریدی که مربوط به این دسته از مشتریان می باشد را از مجموعه داده خود حذف می کنیم.توسط این ویرایش تعداد مشتریان ما 101 مشتری و تعداد رکوردهای خرید ما 608 رکورد خواهد شد.رکوردهای خرید مشتریان در جدول 4-1 نشان داده شده اند.
جدول 4-1 : رکوردهای خرید مشتریان
نام مشتری
نام


پاسخی بگذارید