posted by 구름너머 2007. 4. 30. 13:09
통계표[ 시장금리(일별) ]
항목명CD(91일)
단위연리%
가중치 
변환 
200704275.00
200704264.97
200704254.97
200704244.97
200704234.97
20070422 
20070421 
200704204.95
200704194.95
200704184.95
200704174.95
200704164.94
20070415 
20070414 
200704134.94
200704124.94
200704114.94
200704104.94
200704094.94
20070408 
20070407 
200704064.94
200704054.94
200704044.94
200704034.94
200704024.94
20070401 
20070331 
200703304.94
200703294.94
200703284.94
200703274.94
200703264.94
20070325 
20070324 
200703234.94
200703224.94
200703214.94
200703204.94
200703194.94
20070318 
20070317 
200703164.94
200703154.94
200703144.94
200703134.94
200703124.94
20070311 
20070310 
200703094.94
200703084.94
200703074.94
200703064.94
200703054.94
20070304 
20070303 
200703024.94
20070301 
200702284.94
200702274.94
200702264.94
20070225 
20070224 
200702234.94
200702224.94
200702214.94
200702204.94
20070219 
20070218 
20070217 
200702164.94
200702154.94
200702144.95
200702134.95
200702124.95
20070211 
20070210 
200702094.95
200702084.95
200702074.96
200702064.96
200702054.96
20070204 
20070203 
200702024.96
200702014.96
200701314.96
200701304.96
200701294.95
20070128 
posted by 구름너머 2007. 4. 30. 11:31
주택공시가격, 평균 22.8% 올라 [조인스]
양도소득세와 취득세 부과의 기준 금액이 되는 전국 903만 가구의 공동주택 공시가격이 발표됐다. 지난해보다 평균 22.8%가 올랐고 특히 대형 평형의 상승폭이 컸다. 개별주택은 6.22% 올랐다.

가장 많이 오른 곳은 경기도 과천으로 지난해보다 무려 49.2% 오른 것으로 나타났다. 파주 48.1%, 안양 동안 47.8%, 군포 47.7% 등 경기 지역의 공시가격 상승률이 두드러졌다. 서울에서는 양천구가 46.15%로 공시가격 상승률이 가장 높았고, 강서구와 용산구.강남구 등의 공시가격이 많이 올랐다. 서울과 경기를 제외하고 보면, 인천이 17.0% 올라 상승률이 가장 높고, 대전은 공시가격이 오히려 1.9% 떨어진 것으로 조사됐다.

공시가격이 오르면서 종합부동산세 대상이 되는 6억원 초과 공동주택은 전체의 3%인 27만호로 대부분 수도권에 집중됐다.

한편 전국에서 가장 비싼 공동주택은 서울시서초구서초동 트라움하우스 5차로 나타났다. 230평형인 이 연립주택의 공시가격은 50억4000만원으로 실제 매매가는 70억원에 이른다. 2위는 강남구삼성동 아이파크 104평형으로 공시가격 48억2400만원, 3위는 강남구청담동 상지리츠빌 카일룸2차 187평형으로 40억4000만원이다. 강남구 도곡동 타워팰리스 1차 102평형이 40억800만원으로 4위를 차지했고, 서초동 트라움하우스 3차 185평형과 도곡동 타워팰리스 3차 103평형이 40억원으로 공동 5위에 올랐다.

단독주택 공시가격 상위 10곳은 모두 서울에 있는 것으로 나타났다.

공동주택 가격 열람은 건교부(http://www.moct.go.kr), 또는 시.군구 인터넷 홈페이지를 통해 가능하다. 주택 공시가격에 이의가 있는 주택소유자나 이해관계인은 열람기간인 다음달 30일까지 이의신청서를 주택 소재지 시.군(읍.면.동)에 제출하면 된다. 이의신청서가 제출되면 시장.군수가 감정평가사에게 의뢰해 정밀 재조사와 검증을 한 후 부동산평가위원회 심의를 거쳐 가격조정 여부를 결정하고 6월 말까지 재조정 공시와 함께 개별통지하게 된다.

이여영 기자

2007.04.30 09:41 입력 / 2007.04.30 09:58 수정
WEB
posted by 구름너머 2007. 4. 27. 17:00

1.설치

http://blog.naver.com/choibit?Redirect=Log&logNo=140036224421

2.공식사이트 Ruby 

오픈소스 프로그래밍언어 루비, 매뉴얼 및 튜토리얼 다운로드 제공.

3.ajax

http://blog.naver.com/hmsong95?Redirect=Log&logNo=130014025345

프로그래밍 루비(Programming Ruby)
Dave Thomas, Andy Hunt, Chad Fowler| 강문식, 양석호, 박지인| Insight (인사이트)| 2007.01.20 | 1,100p | ISBN : 9788991268258
평점 7.50 2 참여| 네티즌리뷰 2건| 미디어리뷰 0건
가격 39,000원 → 최저가 35,100가격비교
책찜하기 구매하기 리뷰쓰기
책 정보네티즌리뷰가격비교
종합 | 책소개 | 작가소개 | 목차
책 소개
루비스트 사이에서 곡괭이(PickAxe)로 알려진 『프로그래밍 루비』의 2판의 번역서.
루비가 세상에 나온 지 벌써 12년이 넘었지만, 최근 몇 년간 루비의 위상은 정말 놀라울 정도로 변화하고 있다. 이런 변화의 중심에는 루비의 킬러 애플리케이션인 레일스(Rails)가 있다. 레일스는 루비의 장점을 잘 살렸기 때문에 현재의 위치에 이를 수 있었고, 또 레일스가 기꺼이 루비의 생산성과 실용성을 증명해준 셈이다.
이런 성공의 후면에는 루비만의 독특한 철학이 있다. 루비는 기계나 컴파일러가 아닌 '프로그래머'를 위한 언어다. 루비 개발의 가장 큰 미덕은 그 코드를 작성하는 프로그래머를 행복하게 한다는 것이다. 코드의 간결함으로 탄성을 지르게 하고, 입가에 웃음을 짓게 한다.

이 책을 이용하면 이런 일들을 쉽게 할 수 있다.
* 루비 기초를 배운다. 클래스, 객체, 예외 등 익숙한 개념 뿐 아니라, 반복자, 믹스인, 스레드 등 고급기능도 배울 수 있다.
* CGI 스크립트, XML, SOAP, 템플릿 시스템을 이용해 웹 애플리케이션을 만든다.
* 여러 플랫폼에서 동작하는 GUI 애플리케이션을 만든다.
* 마이크로소프트 윈도우 네이티브 API에 접근하고, 윈도우 애플리케이션을 자동화한다.

이 책을 통해 얻을 수 있는 것
* 루비를 사용하기 위한 친절한 자습서
* 완벽한 언어 참조 매뉴얼

-----------------------------------------------------------------------

[별책]라이브러리 레퍼런스(Ruby Library Reference)

루비로 개발을 할 때 자주 찾게 되는 라이브러리 레퍼런스를 별책으로 제공한다. 별책에는 다음 내용이 담겨있다.
* 모든 내장 클래스, 모듈, 메서드에 대한 문서
* 98개의 표준 ... [강컴닷컴 제공] 더보기
이 책의 통합검색 결과보기 | 책소개 모두보기
TOP
작가 소개
저자 | Dave Thomas
Dave Thomas, Andy Hunt, Chad Fowler
Dave Thomas는 루비 커뮤니티의 주춧돌 같은 사람이며, 앞장서서 커뮤니티의 혁신적인 방향과 독창성을 보여주고 있다. 그와 공저자인 Andy Hunt는 Pragmatic Programmers와 Pragmatic Bookshelf의 설립자다. Chad Fowler는 루비 센트럴의 codirector로서, 루비 커뮤니티에서 활발하게 활동하며 추진력을 보여주고 있다.


강문식 (deepblue@myruby.net)
NHN에서 일했고, 현재는 오픈마루 스튜디오에서 루비스트로 일하며, 더 나은 웹을 만들기 위해 곡괭이질에 한창이다. 행복한 프로그래머가 꿈이며, 요즘 가진 화두는 꾸준히 개선되는 코드다. 한국 루비 사용자 모임(http://rubykr.org)을 운영하고, 루비 공식 홈페이지의 한국어 섹션을 만들었다. 개인 블로그인 ht... [강컴닷컴 제공] 더보기
작가의 통합검색 결과보기 | 작가소개 모두보기
TOP
목차

한국어판 서문
역자 서문
1판 추천사
2판 추천사
서문
책에서 사용한 표기법
로드맵

1부 루비 기본 다지기
1장 루비 시작하기
2장 Ruby.new
3장 클래스, 객체, 변수
4장 컨테이너, 블록, 반복자
5장 표준 타입
6장 메서드 ...

[알라딘 제공] 더보기

'WEB' 카테고리의 다른 글

HTML에서 padding  (0) 2007.07.04
AJAX 관련  (0) 2007.05.28
자바 프로젝트  (0) 2007.03.13
XML to PDF  (1) 2007.03.12
LDAP기술과 표준화 동향  (0) 2007.01.05
posted by 구름너머 2007. 4. 27. 13:40
/**
* @description : 현재일자에서 N일 뒤의 날자를 구하는 함수.
* @param : 일자값에 해당하는 정수.
* @usage : 1일 후의 날자 ==> getNextDay(1);
* : 1달 뒤의 날자 ==> getNextDay(30);
* : 1년 뒤의 날자 ==> getNextDay(365);
* @return : 1)정상수치 : YYYY/MM/DD
* 2)비정상수치 : false
*/
function getNextDay(days) {
if (isNaN(days)){
alert("수치값이 적절하지 않습니다.==>["+days+"]");
return false;
}
var now=new Date(); // 현재 시간을 변수에 할당
now.setTime(Date.parse(now)+(days*24*60*60*1000) ); // 시간값을 설정한다.
return(now.getFullYear()+"/"+(now.getMonth()+1)+"/"+now.getDate() );
//alert("계산일자는 "+now.getFullYear()+"/"+(now.getMonth()+1)+"/"+now.getDate() + " 입니다.");
}

'Java Script' 카테고리의 다른 글

자바스크립트로 클라이언트에 폴더 만들기.  (0) 2007.07.24
문자열 처리하기  (0) 2007.07.12
자바스크립트의 문자열처리  (0) 2007.01.11
vb  (0) 2007.01.02
숫자를 콤마로 변환하기  (0) 2006.12.08
posted by 구름너머 2007. 4. 25. 13:52
공급과잉 '테마쇼핑몰 점포' 경매시장에 쏟아진다
올들어 3월까지 서울서만 600여건 달해
가격도 형편없어 감정가 13%선에 낙찰도


김광수 기자 bright@sed.co.kr

최근 법원 경매시장에 테마쇼핑몰 점포가 무더기로 쏟아지고 있다. 한 유명 쇼핑몰 안에서 20~30개 점포가 나와 있는가 하면 수백개의 점포가 일괄 경매되는 경우도 있다. 전문가들은 공급과잉으로 미분양 점포가 많은데다 경기침체가 지속돼 이미 분양된 점포도 자금난을 견디지 못해 입찰에 부쳐지는 것으로 보고 있다.

26일 부동산정보업체 지지옥션에 따르면 올 들어 3월 현재까지 법원 경매시장에 나온 서울 지역의 유명 쇼핑몰 상가는 약 600여건에 이른다. 동대문 상권에서는 올 들어 ‘밀리오레’ 15개, ‘헬로우APM’ 13개, ‘뉴존’ 39개, ‘시즌’ 20개 점포 등이 경매시장에 등장했다.

또 전자ㆍ패션의류 매장인 구의동 ‘강변 테크노마트’의 경우 18개의 점포가 경매로 나왔고 서초동 ‘국제전자센터’는 11개, 청량리 제기동 ‘한솔동의보감’은 4개 점포가 각각 입찰에 부쳐졌다. 영등포에 위치한 ‘지뗌’은 55개의 점포가 한꺼번에 경매에 부쳐지기도 했고 강남역 상권인 패션의류상가 ‘점프밀라노’는 지난 1월18일 무려 390개의 점포가 일괄 경매될 예정이었으나 입찰 전에 기일이 변경됐다.

강은 지지옥션 팀장은 “개별적인 분양 잔금이나 대출금 미납 등으로 경매에 부쳐지는 것도 있지만 영등포 지뗌이나 강남 점프밀라노처럼 상가 개발회사가 채무를 갚지 못해 무더기 일괄 경매되는 경우도 많다”고 설명했다.

이들 상가는 낙찰되는 가격도 형편없이 낮다. 영등포 ‘지뗌’의 경우 무려 10회나 유찰된 후 1월 11회째 입찰에서 감정가의 13%선에서 한 회사가 낙찰받았다. 한 점포당 감정가가 1억~1억3,000만원이었으나 1,000만원을 조금 넘긴 가격에 낙찰된 것이다. 평균치로 봐도 쇼핑몰의 낙찰률은 다른 상가보다 낮다. 전국의 근린상가나 아파트 단지 상가처럼 공간이 분리된 ‘비오픈형 상가’는 낙찰률이 55.87%인 데 반해 쇼핑몰처럼 칸막이나 간이벽으로 공간을 구분한 ‘오픈형 상가’는 34.66%에 그쳤다.

유영상 상가114 소장은 “테마쇼핑몰은 공급과잉 문제도 심각하지만 최근 온라인쇼핑몰과 백화점ㆍ할인점 등 경쟁 상가들에 밀려 경쟁력을 상실했다는 게 가장 큰 문제”라며 “투자자들도 가격이 싸다고 해서 함부로 응찰하거나 분양받지 말고 영업상태와 임대 수익성 등을 꼼꼼히 따져보고 결정해야 한다”고 말했다.

입력시간 : 2007/03/26 17:48
수정시간 : 2007/03/26 17:57

posted by 구름너머 2007. 4. 25. 13:49

공급과잉 '테마쇼핑몰 점포' 경매시장에 쏟아진다
올들어 3월까지 서울서만 600여건 달해
가격도 형편없어 감정가 13%선에 낙찰도


김광수 기자 bright@sed.co.kr

최근 법원 경매시장에 테마쇼핑몰 점포가 무더기로 쏟아지고 있다. 한 유명 쇼핑몰 안에서 20~30개 점포가 나와 있는가 하면 수백개의 점포가 일괄 경매되는 경우도 있다. 전문가들은 공급과잉으로 미분양 점포가 많은데다 경기침체가 지속돼 이미 분양된 점포도 자금난을 견디지 못해 입찰에 부쳐지는 것으로 보고 있다.

26일 부동산정보업체 지지옥션에 따르면 올 들어 3월 현재까지 법원 경매시장에 나온 서울 지역의 유명 쇼핑몰 상가는 약 600여건에 이른다. 동대문 상권에서는 올 들어 ‘밀리오레’ 15개, ‘헬로우APM’ 13개, ‘뉴존’ 39개, ‘시즌’ 20개 점포 등이 경매시장에 등장했다.

또 전자ㆍ패션의류 매장인 구의동 ‘강변 테크노마트’의 경우 18개의 점포가 경매로 나왔고 서초동 ‘국제전자센터’는 11개, 청량리 제기동 ‘한솔동의보감’은 4개 점포가 각각 입찰에 부쳐졌다. 영등포에 위치한 ‘지뗌’은 55개의 점포가 한꺼번에 경매에 부쳐지기도 했고 강남역 상권인 패션의류상가 ‘점프밀라노’는 지난 1월18일 무려 390개의 점포가 일괄 경매될 예정이었으나 입찰 전에 기일이 변경됐다.

강은 지지옥션 팀장은 “개별적인 분양 잔금이나 대출금 미납 등으로 경매에 부쳐지는 것도 있지만 영등포 지뗌이나 강남 점프밀라노처럼 상가 개발회사가 채무를 갚지 못해 무더기 일괄 경매되는 경우도 많다”고 설명했다.

이들 상가는 낙찰되는 가격도 형편없이 낮다. 영등포 ‘지뗌’의 경우 무려 10회나 유찰된 후 1월 11회째 입찰에서 감정가의 13%선에서 한 회사가 낙찰받았다. 한 점포당 감정가가 1억~1억3,000만원이었으나 1,000만원을 조금 넘긴 가격에 낙찰된 것이다. 평균치로 봐도 쇼핑몰의 낙찰률은 다른 상가보다 낮다. 전국의 근린상가나 아파트 단지 상가처럼 공간이 분리된 ‘비오픈형 상가’는 낙찰률이 55.87%인 데 반해 쇼핑몰처럼 칸막이나 간이벽으로 공간을 구분한 ‘오픈형 상가’는 34.66%에 그쳤다.

유영상 상가114 소장은 “테마쇼핑몰은 공급과잉 문제도 심각하지만 최근 온라인쇼핑몰과 백화점ㆍ할인점 등 경쟁 상가들에 밀려 경쟁력을 상실했다는 게 가장 큰 문제”라며 “투자자들도 가격이 싸다고 해서 함부로 응찰하거나 분양받지 말고 영업상태와 임대 수익성 등을 꼼꼼히 따져보고 결정해야 한다”고 말했다.

입력시간 : 2007/03/26 17:48
수정시간 : 2007/03/26 17:57

posted by 구름너머 2007. 4. 25. 13:30
점포 수 많고 전용률 낮아 수익성은 “글쎄”
경기도 부천시 상동에 자리잡은 테마쇼핑몰 소풍(SOPOOOONG)이 서서히 제 모습을 드러내고 있다.

이 상가의 현재 공정률은 70% 선이다. 건물 골조공사는 거의 마무리 단계에 있고, 외장공사인 창호공사와 유리공사가 한창이다. 올 7월 말 준공을 목표로 내부 인테리어 공사도 빠르게 진행 중이다.

부천시 원미구 상동 539의 1에 위치한 소풍은 매머드급 쇼핑몰이다. 연면적만 5만9972평 규모로, 서울 삼성동 코엑스몰의 1.7배, 롯데백화점 본점의 7.8배에 달한다. 시공은 코오롱건설이 맡고 있다.

지하 3층, 지상 9층 규모로 버스터미널과 전자 전문 상가, 패션ㆍ잡화 매장, 멀티플렉스 영화관 등이 입점할 계획이다. 옆에 버스터미널도들어선다.
상가 내 점포는 8~9월께 본격 입점할 예정이다.

분양 대상 점포 거의 주인 찾아

쇼핑몰 내 점포 분양은 거의 끝냈다. 수영장과 영화관, 터미널등 회사 직영분(연면적의 40% 해당)을 제외한 일반 점포는 지난해 말 분양이 완료됐다는 게시행사인 부천터미널(주) 측 설명이다. 2004년 12월부터 본격적인 분양에 나선 지 2년 만이다.

업계 관계자도 “계약했다가 최근 취소한 점포가 몇 개 정도 있는 것으로 파악되지만 그 비중은 극히 적은 상태로 분양이 거의 다 된 것으로 알고 있다”고 말했다.

부천터미널(주)는 소풍이 부천시의 랜드마크가 될 것으로 자신하고 있다. 소풍의 경우 근접성도 뛰어난 편이다. 부천 계남대로와 중동대로의 교차점에 위치해 유동 인구 확보 면에서 유리한 입지 여건을 갖췄다는 평가다. 또 부천은 물론 일산, 인천, 김포, 광명 등에서 접근하기도 쉽다.

“접근성 뛰어나고 교통 좋은 편”

특히 부천터미널 시외버스 노선이 전국 120개에 이를 예정이어서 소풍은 ‘서서울(수도권 서부지역)’을 대표하는 교통 요충지로 부상할 가능성도 크다.

서울 외곽순환고속도로와 가깝고 이미 착공에 들어간 서울 지하철 7호선 연장사업으로 상동역이 개통될 경우 지하도 개설로 인한 역세권으로서의 가치 또한 한층 높다는 분석이다.
경기도 부천시 상동에 위치한 테마쇼핑몰 소풍이 서서히 제 모습을 드러내고
있다. 7월 말 완공 예정인 이 상가는 현재 70% 선의 공정률을 보이고 있다.


부천터미널 송순구 상무는 “전자ㆍ전문 쇼핑몰로 특화될 소풍은 인천은 물론 김포, 광명, 일산, 시흥, 안산 등지와 서울 서부지역에서 전자 통신 관련 제품을 구입하려는 고객들의 단골 방문 코스가 될 것”이라고 말했다.

소풍은 수도권 서부지역에서 거의 유일한 전자 전문 쇼핑몰로, 3ㆍ4ㆍ5층 등 3개 층 1만7000여평에 컴퓨터 소ㆍ대형 가전 및 정보통신 관련 상가가 집중적으로 들어설 예정이다.

아울러 소풍은 복합 문화 공간으로 경쟁력을 갖췄다는 게 시행사 측 설명이다. ‘도심 속 자연’을 테마로 잡아 실내에 지름 4m, 높이 38m 규모의 나무 모형이 지하 1층에서 지상 5층까지 관통하며 옥상정원과 인공암벽, 인공폭포 등도 조성된다.

소풍에는 워터파크도 들어선다. 건물 7층에 2000평 규모로 조성될 워터파크는 스파 시설 및 휴식시설을 갖출 것이라고 한다. 무엇보다 10m 높이의 공간에 자연광이 들어온다는 장점이 있다.

부천터미널 관계자는 “판매시설만 있는 단순한 쇼핑몰이 아닌 문화 복합 공간으로 조성되기 때문에 건물 완공 후에는 상당수의 경기 서북권 지역 거주민들이 이곳을 찾을 것 같다”고 말했다.

투자 가치 있나

하지만 투자성에 의문을 제기하는 전문가들도 적지 않다. 우선 쇼핑몰 내 점포 수가 너무 많다는 지적이 일고 있다. 소풍 건물 3~5층에만 컴퓨터ㆍ가전ㆍ정보통신 관련 점포 1450곳이 들어선다. 서울 강변 테크노마트와 용산 스페이스나인과 거의 맞먹는 수준이다.
상가뉴스레이다 정미현 연구원은 “유동 인구에 비해 같은 쇼핑몰 내에 경쟁 점포 수가 많다는 것은 그만큼 상가 매출액 감소와 함께 수익성 악화를 초래할 가능성이 크다”고 말했다.

부천 소풍의 경우 주변 지역에 전자 전문 상가가 많지는 않지만 유동인구 등 고객 확보 면에서 서울 강변 테크노마트나 용산 스페이스나인보다 훨씬 뒤쳐진다는 게 업계의 일반적인 분석이다.

실제 점포 활용 공간인 전용률이 낮다는 것도 단점으로 꼽힌다. 소풍의 경우 1층 점포 전용률은 27%에 머물고 있다. 나머지 층도 30% 초반 수준이다. 하지만 다른 쇼핑몰의 경우 점포 전용률이 보통 40%대이다. 근린상가의 경우 대개 55~60% 수준이다. 상가정보연구소 박대원 수석연구원은 “점포 전용률이 낮다는 것은 전용면적 대비 분양가를 따져봤을 때 높은 분양가로 상가가 공급됐을 가능성이 크다”고 말했다.

소풍의 상가 분양 면적 대비 가격은 1층의 경우 평당 1800만~2300만원, 2층은 1300만~1400만원, 3층은 900만~1000만원 선이다. 부천과 인근 인천지역에서 최근 몇년새 분양한 쇼핑몰 분양가와 비슷한 수준이다. 더욱이 소풍의 경우 전용률이 다른 쇼핑몰에 비해 낮다는 점을 감안하면 실제 활용 가능한 점포 면적 대비 분양가는 훨씬 높아지게 된다는 게 전문가들의 설명이다.

상가114 유영상 소장은 “유동인구가 많고 배후상권이 잘 발달돼 있더라도 분양가가 주변 시세보다 높으면 투자성이 떨어지게 마련”이라며 “미래수익에 대한 판단과 책임은 투자자 본인에게 있는 만큼 현장을 직접 확인하고 꼼꼼히 점검할 필요가 있다”고 말했다.

<저작권자(c)중앙일보조인스랜드. 무단전재-재배포 금지.>
IT
posted by 구름너머 2007. 4. 22. 13:10

데이터마이닝 기법 : 연관규칙의 탐사

전치혁
포항공과대학교
산업공학과 교수


1. 서언

연관규칙(association rule)이란 간단히 말하면 데이터의 항목들 간의 조건-결과 식으로 표현되는 유용한 패턴을 말한다. 연관규칙의 탐사는 기업의 활동, 특히 마케팅에서 가장 널리 사용되고 있다. 예를 들면, 미국의 슈퍼마켓에서 목요일 기저귀를 사는 고객은 맥주도 동시에 구매한다는 연관성을 알아냈다고 한다. 이때, 조건은 ‘목요일, 기저귀’이며 결과는 ‘맥주’라 할 수 있다. 이와 같은 연관규칙의 탐사가 가능하게 된 것은 컴퓨터기술의 발전을 들 수 있겠다. 한 고객이 슈퍼마켓의 계산대에서 계산할 때 쇼핑카트에 담긴 물품들이 바코드를 통하여 컴퓨터에 데이터베이스 형태로 입력되고 이로부터 고객들의 구매행태를 분석할 수 있게 되었다.
위에서 언급한 데이터의 형태는 소위 바스켓(basket) 데이터라 한다. 이 때 한 고객, 즉 한 바스켓의 정보를 하나의 트랜잭션(transaction)이라 한다. 바스켓 형태의 데이터에서는 주로 트랜잭션 내의 연관성을 살펴보고자 하는 것으로, 수많은 트랜잭션을 분석하여 빈번히 나타나는 규칙을 찾아내는 것이다. 이렇게 찾아낸 규칙은 마케팅에 활용된다. 예를 들어, 위의 기저귀-맥주의 규칙을 활용하여 기저귀와 맥주를 가까운 곳에 진열함으로써 매출 신장을 기할 수 있다. 이와 같이 바스켓 데이터로부터 연관규칙을 탐사하는 것을 시장바구니분석(market basket analysis)이라 한다.
연관규칙의 탐사는 한 고객의 시간에 따른 구매정보를 활용하여 이루어지기도 한다. 예를 들면, 가전제품 대리점에서 고객별 시간별 구매제품의 데이터를 활용하여 ‘제품 A를 사는 고객은 추후에 제품 B도 구매한다’는 연관규칙을 이끌어낼 수 있을 것이다. 이와 같은 패턴을 얻어 제품 A를 구매하였으나 제품 B를 구매하지 않은 고객에게 판매활동을 할 수 있다. 이런 시간에 따른 고객데이터를 시퀀스(sequence) 데이터라 한다.
당연한 사실이지만 탐사에서 도출된 연관규칙은 분명하고 유용한 것이어야 한다. 유용하다(useful)는 것은 새롭고도 실행가능하며 설명할 수 있는 것을 말한다고 하겠다. 이에 비해 사소한(trivial) 규칙이란 이미 잘 알려진 사실을 말한다. 예를 들면, ‘페인트를 사면 페인트 붓을 산다’ 는 규칙 같은 것이다. 또한, 설명할 수 없는 규칙은 데이터의 오류일 가능성도 있으며 마케팅에 활용할 수 없기 때문에 역시 유용하다고 볼 수 없다.



2. 연관규칙의 정의 및 성능척도

데이터베이스가 총 n개의 트랜잭션 데이터로 구성되며 전체 m개의 항목으로 구성된다고 하고 이를 I 라 하자. 연관규칙 R은 조건부와 결과부로 구성되며 항목집합인 X와 Y에 대하여 ‘X가 일어나면 Y 도 일어난다’는 의미로 다음과 같이 표현할 수 있다.

R : X ⇒ Y

여기서 X,Y⊆I 이고, X∩Y=Φ이어야 한다. 따라서 연관규칙을 탐사함은 적절한 항목집합 X와 Y를 선택하는 문제로 볼 수 있으며 이를 위해 몇 가지 척도를 고려하고 있다. 우선, 항목집합 X 및 규칙 R에 대한 지지도(support)는 각각 다음과 같이 정의된다.

supp(X) = 집합 X의 항목을 동시에 포함하는 트랜잭션 수의 전체 수(n)에 대한 비율
supp(R) = supp(X∪Y)

즉, 규칙 R에 대한 지지도는 집합 X 또는 집합 Y에 있는 항목을 동시에 포함하는 트랜잭션수의 비율을 나타낸다.

예 1. 다음과 같은 5개의 트랜잭션을 고려해 보자.

트랜잭션
항목
1b, c, g
2a, b, d, e, f
3a, b, c, g
4b, c, e, f
5b, c, e, f, g

이때 전체 항목집합 I는 I = {a, b, c, d, e, f, g} 이다. 몇 가지 항목집합에 대한 지지도를 구하면 다음과 같다.

supp({a}) = 2/5 = 0.4, supp({b, c}) = 4/5 = 0.8

다음과 같은 규칙을 고려해 보자.

R: “항목 b와 항목 c가 일어나면, 항목 g도 일어난다”

이 때 규칙 R에 해당하는 항목집합 X와 Y는 다음과 같다.

X={b, c}, Y={g}.

이 경우 X 및 규칙 R에 대한 지지도는 각각 아래와 같이 산출된다.

supp(X) = supp({b, c}) = 0.8
supp(R) = supp({b, c, g}) = 3/5 = 0.6

연관규칙 R의 가치를 평가할 때 통상 다음과 같이 정의되는 신뢰도(confidence)를 사용한다.

conf(R)= supp(X∪Y)/supp(X)

이 신뢰도는 조건부 확률의 개념으로 집합 X(조건)가 발생한다고 할 때 집합 Y(결과)도 동시에 발생할 확률을 의미한다. 즉, 트랜잭션에 X의 항목들을 포함하는 경우 Y의 항목들도 동시에 포함할 확률을 나타내며, 신뢰도가 큰 규칙일수록 의미가 크다고 하겠다.
또한, 신뢰도 이외에 연관규칙의 개선도(lift or improvement)를 함께 사용하는데, 이는 결과가 단독으로 발생할 빈도에 대한 조건과 연계하여 결과가 발생할 가능성의 빈도의 비로 정의된다.

개선도가 1이 됨은 가 성립하므로 항목 집합 X와 Y의 발생이 독립임을 의미한다고 하겠다. 그리고 개선도가 1 전후의 값에 따라 다음과 같은 해석을 할 수 있다.

- lift(R) > 1인 경우, X와 Y의 발생이 양의 상관관계
- lift(R) < 1인 경우, X와 Y의 발생이 음의 상관관계

따라서 개선도가 1보다 큰 규칙이야말로 우연한(랜덤한) 관계가 아닌 필연적 관계를 나타낸다고 하겠다.

3. 연관규칙의 탐사

연관규칙의 탐사는 결국 신뢰도 또는 개선도가 높은 규칙 R을 트랜잭션 데이터로부터 도출하는 과정이다. 따라서 규칙이 R : X ⇒ Y의 형태일 때 적절한 항목집합 X와 Y를 찾는 것이라 할 수 있겠다. 그러나 모든 항목의 조합을 고려하여 성능이 좋은 규칙을 찾는 일은 쉬운 것이 아니므로 이를 위한 효율적인 알고리즘이 요구된다. 예로써 예 1.의 7개 항목으로 구성된 5건의 트랜잭션 데이터에 대하여 집합 X의 후보가 되는 경우수를 볼 때, 1개 항목으로 구성되는 경우가 7가지, 2개의 항목으로 구성되는 경우가 21가지, 3개의 항목으로 구성되는 경우가 35가지 등이 될 것이다.
연관규칙의 탐사를 위한 알고리즘으로 기본적이며 가장 널리 사용되는 것은 1994년에 Agrawal 및 Srikant가 발표한 Apriori 알고리즘으로 다음의 두 단계로 구성된다.

단계 1. 미리 결정된 최소지지도 smin 이상의 지지도를 갖는 모든 빈발 항목집합들(large itemsets)을 찾는다.
단계 2. 빈발 항목집합 L에 대한 부분집합 A를 고려한다. 미리 결정된 최소신뢰도 cmin에 대하여 supp(L)/supp(A) ≥ cmin 이면, R: A ⇒ (L-A) 형태의 규칙을 출력한다. 즉, 이 규칙의 지지도는 supp(R)=supp(L)이며, 신뢰도는 conf(R)=supp(L)/supp(A) 가 된다.

3.1. 빈발 항목집합 생성

빈발 항목집합을 도출하기 위하여 우선 하나의 항목으로 이루어지는 후보집합군(C1)을 형성하고 최소지지도 이상을 갖는 집합군(L1)을 생성한다. 다음으로 L1으로부터 두개의 항목으로 이루어지는 후보집합군(C2)를 만들고 최소지지도 이상을 갖는 집합군(L2)을 생성하며, 다시 L2로부터 세 항목으로 이루어지는 후보집합군(C3)과 빈발 항목집합군 L3를 만드는 등 이러한 과정을 더 이상 새로운 집합이 생성되지 않을 때까지 반복한다.
로부터 를 생성할 때 접합(join)연산자(*)를 사용한다. L1으로부터 C2를 만드는 경우에는 L1의 한 항목에 대한 모든 조합이 2-항목 집합인 C2가 될 것이다. 그러나 L2에서 두 집합의 조합은 최대 4개의 항목을 포함할 수 있으므로 C3를 형성할 때 L2의 집합 중 하나의 항목이 동일한 것들만 대상으로 하여야 한다. 마찬가지로 L3로부터 C4를 형성할 때는 L3의 집합 중 두개의 항목이 동일할 때 가능하게 된다. 예로써, L2=[{a,b}, {a,c}, {b,d}]라 할 때 {a,b,c}와 {a,b,d}가 3-항목 집합의 후보가 될 것이다. 그러나, C3를 구성할 때 {a,b,c}는 제외된다. 왜냐하면, {a,b,c}의 지지도는 {b,c}의 지지도 이하인데 {b,c}가 L2에 포함되지 않았다는 것은 이의 지지도가 최소지지도 미만이라는 것을 나타내기 때문이다. 이러한 과정은 Apriori 알고리즘 중 'apriori-gen' 함수에 의하여 수행된다.

예 2. (예 1.의 계속). 예 1.의 트랜잭션 데이터를 바탕으로 빈발 항목집합을 만들어보자. 우선, C1은 다음과 같다.

C1=[{a}, {b}, {c}, {d}, {e}, {f}, {g}]

최소 지지도를 0.4(5개의 트랜잭션 중 2개)라 하면 1-항목으로 이루어지는 빈발 항목집합군은 다음과 같다.

L1=[{a}, {b}, {c}, {e}, {f}, {g}]

2-항목 빈발집합의 후보 C2에 다시 최소지지도 0.4를 적용하면 L2는 다음과 같다.

L2=[{a,b}, {b,c}, {b,e}, {b,f}, {b,g}, {c,e}, {c,f}, {c,g}, {e,f}]

C3를 구성하기 위하여 L2의 집합에 접합연산자를 적용하면 다음과 같다.

C3=[{b,c,e}, {b,c,f}, {b,c,g}, {b,e,f}, {c,e,f}]

이 때 {a,b,c} 는 {a,c}가 L2에 포함되지 않았으므로 C3에 포함될 수 없음을 볼 수 있다.
C3의 모든 집합은 최소지지도 이상이므로 L3는 C3와 동일하다.

Apriori 알고리즘을 단계별로 정리하면 다음과 같다.

단계 0. 최소지지도 smin을 정한다.

k=1
C₁=[{i₁},{i₂},...,{im}]
L₁={c∈C₁| supp(c) ≥ smin

단계 1. k=k+1

Lk-1로부터 Ck 형성 (apriori-gen 함수)
단계 1-1. (join) Lk-1의 집합들을 접합하여 k- 항목 집합군을 형성한다.

C= Lk-1 * Lk-1

단계 1-2. (prune) C의 (k-1)- 항목 부분집합이 Lk-1에 속하지 않을 때 이를 모두 제거한 후 Ck를 형성한다. Ck=Φ이면 Stop.

단계 2. Ck의 집합 중 지지도가 최소지지도 이상인 것을 모아 Lk를 생성한다.

Lk={c∈Ck | supp(c) ≥ smin}

3.2. 규칙의 탐사

앞에서 언급한 바와 같이 규칙의 탐사를 위하여 우선 도출된 빈발 항목집합 L 각각에 대한 부분집합 A를 고려한다. 여기서 L은 위의 L2, L3 등을 포함한다. 그리고, 미리 결정된 최소신뢰도 cmin에 대하여 supp(L)/supp(A) ≥ cmin 이면, R: A ⇒ (L-A) 형태의 규칙을 출력한다. 즉, 이 규칙의 신뢰도 conf(R)=supp(L)/supp(A) 가 cmin 이상 되도록 하는 것이다.
현실의 경우 결과부에 하나의 항목만을 포함시키는 규칙을 도출하는 것이 이의 적용성 때문에 널리 사용되나, Agrawal & Srikant (1994)의 알고리즘에는 모든 가능한 규칙을 보다 효율적으로 탐사하는 방법이 소개되고 있다.

예 3. 예 1.의 트랜젝션 데이터에 대하여 예 2.에서 구해진 빈발 항목집합군 중 집합 L={b,c,g}을 고려해 보자. 이 때 결과부에 1-항목을 포함하는 규칙의 후보와 이에 대응되는 신뢰도는 다음과 같다.

R1: {b,c}⇒{g} conf(R1)=0.6/0.8 = 0.75
R2: {b,g}⇒{c} conf(R2)=0.6/0.6 = 1
R3: {c,g}⇒{b} conf(R3)=0.6/0.6 = 1

따라서 최소신뢰도를 0.7이라 하면 R1, R2, R3 모두 최소신뢰도 이상이 된다.

4. 결언

서언에서 언급한 시퀀스 데이터에 대하여도 유사한 알고리즘이 적용되고 있으나 여기서는 생략한다.
한편, 분석할 트랜잭션 데이터에 어떤 항목들을 포함시킬 것인가는 분석에 앞서 결정하여야 할 중요한 문제 중 하나라 하겠다. 통상 슈퍼마켓 등에서 취급하는 제품 수는 수만 가지가 넘기 때문에 이러한 제품 하나하나를 모두 항목으로 선정하기에는 여러 어려움이 있다. 따라서 제품을 계층적으로 분류하여 적절한 계층에 속하는 것들을 항목으로 선정하는 방안을 사용한다. 제품분류에서 상위수준으로 갈수록 보다 포괄적인 항목(generalized item)이 사용된다.
항목이 너무 세분화되어 많은 경우 공통 항목의 트랜잭션 수가 적어 유용한 규칙을 도출하기 어려울 수 있으며, 반대로 항목이 너무 작은 경우에는 도출된 규칙이 쓸모없을 수 있기 때문에 항목의 선정이 중요하다 하겠다. 또한, 항목이 증가함에 따라 규칙탐사에 소요되는 계산시간이 급속도로 증가하기 때문에 원하는 계산복잡도에 알맞은 항목수를 결정할 필요가 있다. 항목을 선정하는데 있어 하나의 가이드라인은, 트랜잭션 데이터에 드물게 나타나는 것은 제품의 계층적 분류에서 보다 상위 수준의 항목을 사용하고, 자주 나타나는 경우에는 보다 하위 수준의 항목을 사용하여 결과적으로 트랜잭션 데이터에 빈도수가 비슷하게 되도록 하라는 것이다.

출처 : Tong - garage님의 웹기획/마케팅/카피통

'IT' 카테고리의 다른 글

BCP의 개요 및 개발 과정  (1) 2007.05.07
S/MIME의 개요  (0) 2007.05.07
데이터마이닝 기법중에 대표적인것 5가지  (0) 2007.04.22
데이터마이닝 개론  (0) 2007.04.22
데이터 저장 기술  (0) 2007.04.22