评估前沿:房地产批量估价技术的应用分析

本文将根据房地产批量估价技术中的人工参与程度,将现行批量估价的技术方法分为以人工为主的技术方法、以计算机技术为主的技术方法和以人工与计算机技术相结合的技术方法三类,来进行讨论和研究。
以人工为主,是指在参数设定、价格评估等环节主要还是依靠估价师的知识和经验;以计算机技术为主,是指参数的设定、价格评估等都是通过预先设定的算法由计算机从大量的案例数据和其他相关数据中进行挖掘和分析得到的。
一、以人工为主的技术方法之标准价调整法
1.标准价调整法的概念
标准价调整法,作为市场比较法派生出来的一种方法,类似于城市拆迁评估中的基准价格修正法和香港的指标估价法,但又有其自身的特点。标准价调整法可定义为:在一定区域内对所有被估价房地产进行分组,使同一组内的房地产具有相似性,在每组内设定标准房地产并测算其价值,利用相关调整系数将标准房地产价值调整为各宗被估价房地产价值或价格的方法。标准价调整法适用于估价对象物业属性和估价特性较为近似的物业,尤其适用于小范围且价格影响因素少的房地产批量估价。
2.标准价调整法在不同物业类型中的应用
标准价调整法的实施涉及了估价分区的划分、标准房的设定、价格修正系数的设定以及标准房价格的评佔。无论应用于哪种物业类型,这四个步骤必不可少,差异在于各步骤的具体实施方法不尽相同。
在住宅物业的批量估价中,往往以小区作为估价分区的划分,在一个小区内根据一定规则设定一个标准房,再由有经验的估价师根据实地调研情况设置标准房与其他房屋之间的价格差异系数,最后仍旧由估价师定期对标准房进行估价,并通过已设定的系数求得所有物业的价格。
在办公物业的批量估价中,差异在于分区是以楼栋或项目来划分,后续步骤和住宅物业的评估一致。
在集中型商业物业或工业物业中,可以借鉴上述方法来进行操作。但在沿街零售型物业中,由于沿街零售性物业分布广泛,没有明显的集中趋势,并且价格影响因素的差异较大,导致标准价调整法的应用也与其他物业类型有较大不同,主要表现在估价分区的划分和价格修正系数的设定这两个环节。现有的技术方案一般采取两级调整。按商圈(或类似因素)将城市区域划分成诸多估价分区,在每个分区中设定一个标准商铺,称为区域基准商铺。之后在分区内再进行一次估价分区的划分,这一划分以路段为分区,在每个路段中设定一个标准商铺,称为路段基准商铺。估价人员经过现场调研后,需设置两级修正系数,即区域基准商铺与路段基准商铺的价格调整系数,以及路段基准商铺与路段内其他商铺的价格修正系数。最后经估价师定期对区域基准商铺进行估价,并通过两级系数的修正求得所有商铺的价格。
3.标准价调整法的优点
(1)在规模较小的城市中,可以实现绝大部分物业的批量估价需求,具有较强的实用性。
(2)可以达到较高的批量估价覆盖率。
( 3)估价准确性较好,并具有较好的质量可控性。
(4)除建设初期投入的人员成本和时间成本较大,后续维护的成本适中。
4.标准价调整法的缺点
(1)由于人工作业的工作量太大,不适用大、中型城市。
(2)对估价人员的经验要求较高,尤其是系数设置与标准房的价格评估等环节对质量的要求很高。团队运作时,需要具备较高的质量管理能力。
(3)不同物业间的系数关系可能受到市场、规划等因素的影响,需要定期进行监控和维护,有一定的难度,容易疏忽、遗漏。
二、以人工为主的技术方法之多元线性回归模型
1.多元线性回归模型简述
多元回归分析是目前在国外批量估价中占主流的校准技术,包括线性回归分析和非线性回归分析。其基本原理是,在大量样本的基础上,通过对变量、误差的假定,依靠最小二乘法来拟合因变量与自变量关系,从而建立数学模型。
多元回归是一个统计学方法,运用时需要和经济学理论结合,实践中对多元回归模型的应用是基于特征价格理论。国内关于运用特征价格理论来进行批量估价也有较多的研究和学术论文,但绝大多数还处于理论研究阶段。
2.多元回归分析的主要步骤
多元回归既可以用来预測售价,也可以用来预测租金,甚至可以用来统计其他中间参数。在步骤上不同类型的物业没有明显的区别,只是在变量的选择与量化上有所不同。为便于表述,下面以预测办公物业价格为例来进行阐述。
(1)选取样本:为了训练预測办公物业价格的模型方程,在目标范围内选取一定数量的样本,调研其价格信息和基础信息。这里的重点是样本对总体的代表性以及样本数据采集的准确性。
(2)构建办公物业价格影响因素体系:通过调研分析以及房地产专家意见调查,归纳出可能影响办公物业价格的特征变量,并进行赋值量化。
(3)模型拟合:观察、分析特征变量的变动规律,采用统计分析软件进行分析,对模型和特征变量赋值不断地尝试和修正,找出合理的价格和各特征变量之间的定量关系。
(4)模型检验:最终得到的模型是否成功,取决于如下的检验:经济意义检验、统计检验、计量经济学检验以及模型预测检验。其中统计检验包括了拟合优度检验和显著性检验;计量经济学检验包括多重其线性检验及异方差检验等。但凡通过上述所有的检验,即可认为模型已成功建立。
(5)模型应用:对办公物业的特征变量进行赋值,代入最终的模型进行自动计算,即可评估办公物业的价格。
3.多元线性回归模型的优点
(1)多元回归方法所涉及的工作量主要在于特征变量的数量以及特征变量的赋值容易程度,受城市规模的影响较小,因此可‘以适用于大中型及以上城市。
(2)多元回归方法通过拟合因变量与自变量关系从而建立数学模型,这个过程与何种物业类型无关,因此理论上多元回归方法适合各类型物业的批量估价建模。
(3)通过“调整r方”和“标准误差”两项指标,基本可以判断和掌握模型价格估计的准确度,并且可以对模型进行持续改进,从而保证批量估价的淮确性。
(4)在市场稳定时期,由于自变量与因变量的关系也较为稳定,因此模型更新维护的成本较低,从而价格更新的成本也较低。
4.多元线性回归模型的缺点
(1)在不同区域或不同市场,价格的影响因素不尽相同,建立的回归模型也不相同。因此对每个城市每个物业类型的市场需要分别建立回归模型。
(2)多元回归建模研究过程的理论假设、建模方法、数据采集等环节,需要综合的知识、经验和技能。除了房地产估价师所需具备的估价理论知识、实务经验、调研及价格判断能力外,还需要统计学、经济学等多学科知识,对人员和团队的综合能力要求很高,而这往往是传统估价机构所欠缺的。
(3)对样本数据的准确性要求较高。如果没有准确的样本数据,建立科学的经济学模型则为空中楼阁。而获得准确的样本数据,长久以来就是个难题,其中有人为的因素(如交易避税),也有客观的因素(如商业物业的交易活跃度低)。
(4)在市场波动大的时候,原有模型可能失效或者预测能力大幅下降,而模型的迭代或维护周期较长,可能无法及时调整
三、以计算机技术为主的技术方法
房地产批量估价领域中以计算机技术为主的技方法主要是基于大数据的数据挖掘。这一技术的应用最早开始于房地产互联网企业,如我们熟知的搜房、安居客等房源网站,后来逐步被引入到房地产批量估价的技术或产品研发中来。
1.数据挖掘的方法和原理
数据挖掘的前提是需要有大量的数据可供挖掘。随着互联网不断在各行各业渗透,房地产经纪行业中出现了众多房源网站,并逐步成为房地产经纪人发布房源信息招揽客户的主要渠道。一个房源网站中可以搜索的房源数量多达数十万甚至上百万条,并且每天都有数万条以上的数据更新。这样的网站有不少,为房地产的数据挖掘提供了可行的前提。
其次,结构化的数据为数据的采集提供了便利。在房源网站中,房源已经按小区进行了分类,经纪人发布哪个小区的房源,则该房源将展现在该小区的搜索项下。至于面积、户型、价格、楼层以及装修等参数,也都以格式化的方式来展现。因此,利用互联网爬虫等抓取技术,可以很方便地将这些网站的房凉信息抓取下来,建立房源案例数据库。
接下来是数据挖掘工作。数据挖掘一般是指从大量的数据中通过算法搜索出隐藏于其中的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。根据上述定义和描述可以发现,数据挖掘的核心是算法。而这个算法在不同的批量估价系数或产品中都不相同,算法的优劣也决定了不同系统或产品的优劣。
2.数据挖掘方法的优点
(1)高效无疑是数据挖掘方法的最大优点。—旦完成对算法的研究,价格估算的工作都可以交由计算机来完成。
(2)对整体市场价格运行的反映具有较高的准确度。
3.数据挖掘方法的缺点
(1)对微观市场价格运行的反映可能存在较大偏差。微观市场中,例如一个住宅小区,其挂牌房源的数量很有限,即使规模最大的小区,其挂牌房源也就是几百的数量级。由此来看,大数据挖掘的数据数量前提已不满足,从而影响了对微观市场的价格估计。
(2)批量估价的覆盖面不完整。互联网数据虽然总量巨大,但并非面面俱到。以住宅小区为例,一些体量较小的小区或者一些远郊区域,可能无法在互联网上被搜索到。因此,基于互联网数据挖掘的批量估价势必在覆盖面上存在缺陷。
四、以人工与计算机技术相结合的技术方法
房地产批量估价,尤其是涉税的批量估价对评估系统的要求主要有:全面覆盖所有物业、估价结果准确以及系统维护成本适中。根据前文对各方法的论述,单一方法很难实现上述要求。如标准价调整法若在大型或超大型城市中应用,将面临很高的运营成本;多元回归建模的更新维护周期较长,当市场出现快速波动时可能无法及时调整;基于大数据的数据挖掘在估价精度与覆盖面上有所欠缺。
总之,无论从技术上论证,还是从实施效果来看,多种方法的有效结合是较为理想的,也是房地产批量估价技术的发展趋势。实践中各方法的结合已得到普遍应用,并且各有巧妙之处,不尽相同。下面就几种简单的组合方式进行讨论。
1.标准价调整法与大数据挖掘技术的组合
数据挖掘可以满足一些活跃小区的价格估算,因为活跃小区的挂牌房源较多,能满足算法所要求的数据量前提,而不活跃的小区则无法为算法提供足够的“原材料”,因此不适用数据挖掘的方法。这时就可以运用标准价调整法来弥补。按照标准价调整法的原理,在不活跃小区的临近或相似区域内设置一个标准房,经人工调研后设置标准房与不活跃小区价格的调整系数。这样在算法得出活跃小区价格的同时,就可以利用预先设置好的系数一并计算不活跃小区的价格。
此外,在算法可以计算的活跃小区的价格中,根据前文所述,也有可能存在价格偏差。这时也可以应用标准价调整法的思路,设置活跃小区间的价格调整系数,来检验算法所得结果的合理性。
这一组合的应用前提主要是存在大量数据可供挖掘,因此适合房地产市场规模较大、“互联网+”比较发达的城市和地区。此外,在结合了大数据挖掘技术后,标准价调整法可以应用到大型及以上城市,克服了其原有的一大弊端。
2.多元回归模型与大数据挖掘技术的组合
除了对人员的能力及样本数据的质量要求较高以外,多元回归模型最大的弱点在于迭代问题。市场不断变化,模型不可能一成不变,当市场发生变化并导致变量之间的关系也发生改变时,原有模型的价格预计精度必然下降,此时必须对模型进行重新构建。
问题在于,市场价格变化未必会导致变量间的关系也发生变化(或变化很小),且当变量间关系发生变化时,人员主观上可能无法及时发现;当主观能够感受到变量间的关系出现变化时,往往已经有了很大的变化,此时再进行模型的迭代就已经晚了,之前的价格估算可能已经出现了错误。
大数据挖掘技术可以很好地弥补上述缺陷。大数据挖掘不仅可以直接计算某些具体变量,任何数据内在的规律和关联都可能应用大数据挖掘的方式进行探索和发现,并且能对极为细小的数值波动进行反应。利用数据挖掘的这一特性,我们可以建立对变量的波动监控,当波动超过一定的预设阀值时,即可启动模型的迭代更新。
这一组合的应用前提同样是存在大量数据可供挖掘。除了在城市规模有限等情况下不适用,在商业物业、工业厂房等物业市场也不适用。
3.标准价调整法与多元回归模型的组合
标准价调整法往往适用于特性相近的物业,如在一个小区中设定一个标准房,再设定标准房与其他房屋的价格�...