基于對手態(tài)度學習的協(xié)商決策模型

 321

在自治的多Agent系統(tǒng)中,Agent一般都有自己的目標,其行為不會被其他Agent控制,協(xié)商成為多Agent系統(tǒng)中Agent之間達成合作意向的重要方式.在協(xié)商中,Agent的理性要求自己利益的最大化,但如果Agent一味強調自身的利益往往很容易造成協(xié)商的破裂.因此在協(xié)商中,需要考慮到對手的情況。但在如電子商務、自治計算競爭環(huán)境中,Agent并不會主動公布自己的私有信息.對于Agent來說唯一可以獲得的就是協(xié)商過程中對方所發(fā)來的建議,學習對手的建議值的序列,成為了獲得對手信息的一個有效的方法。

自動協(xié)商領域中已有不少研究工作用到了學習的方法.Sycara開創(chuàng)性地把機器學習的方法用到了決策模型中.隨后學習的方法被廣泛地用在了協(xié)商的決策模型中.目前的學習算法在協(xié)商中主要用于兩個方面:一是優(yōu)化協(xié)商戰(zhàn)略,主要用到的學習算法有遺傳算法、Reinforcement算法.另一個方面是通過學習協(xié)商的過程來預測對手的偏好和保留值(可容忍值).其中用到的學習算法有貝葉斯方法、KDE算法.但并沒有相關的工作來學習協(xié)商對手的態(tài)度。

本文提出用學習的方法來獲得對手的協(xié)商態(tài)度,并應用支持向量機實現(xiàn)了具體的學習方法.利用得到協(xié)商對手的態(tài)度,進一步提出了一種協(xié)商決策模型.此模型綜合考慮了對手的協(xié)商態(tài)度和自身的利益.模型能有效減少協(xié)商的時間,增加協(xié)商雙方的效用總和。

1 協(xié)商框架

協(xié)商定義為如下一個四元組:

2 學習對手的協(xié)商態(tài)度

2.1 協(xié)商過程的表示

 協(xié)商 模型 決策 基于 對手 態(tài)度 學習

擴展閱讀

2024年4月17日—19日,太古可口可樂第2期3天2夜降本增效行動學習工作坊在上海啟動,來自太古可口可樂全國各基地的經管人員參加了集訓。姜上泉導師分享了降本增效規(guī)劃、營銷創(chuàng)收增效、營業(yè)成本降低、組織

  作者:姜上泉詳情


2024年3月9日—10日,華潤三九醫(yī)藥股份國藥事業(yè)部2024年降本增效行動學習啟動會在深圳召開,國藥事業(yè)部60多位核心中高層經管人員出席了會議。華潤三九醫(yī)藥股份有限公司是大型國有控股醫(yī)藥上市公司,主

  作者:姜上泉詳情


Business Leadership Model起源于IBM,是一個中高層用于戰(zhàn)略制定與執(zhí)行連接的方法與平臺。至今,華為對該模型的實踐應用深度與廣度,已經遠遠超過IBM。華為不僅將這個模型應用于公司

  作者:曹揚詳情


  一個顧客走到我們柜臺,問格力的那個紅色的多少錢,因為她的朋友都是在專賣店買的,她想多了解一下情況,并把專賣店的價格告訴了我。我說這里的價格要貴一點,因為服務有保證,并趁機向她介紹了我們的海信空調。

  作者:高定基詳情


營銷決策與營銷實務   2023.03.24

  對于市場營銷的定義是從市場和營銷的整合和延伸開始的,市場作為一個獨立的運營單元,承載著消費者、消費需求、消費理念和消費行為的集合,而營銷則是通過對消費者消費行為的研究,通過一系列的銷售行為和動作,

  作者:崔學良詳情


學習馮侖好榜樣   2023.03.08

前幾天上海天氣突變,由高溫轉成這幾天的涼爽,由于自己大意而在前天(星期二)中午突發(fā)高燒至38度以上并伴隨頭暈,由于已確認昨天(星期三)上午為一知名企業(yè)作房地產市場和投資內部培訓,雖然對演講內容的非常熟

  作者:張健詳情


版權聲明:

本網刊登/轉載的文章,僅代表作者個人或來源機構觀點,不代表本站立場,本網不對其真?zhèn)涡载撠煛?br /> 本網部分文章來源于其他媒體,本網轉載此文只是為 網友免費提供更多的知識或資訊,傳播管理/培訓經驗,不是直接以贏利為目的,版權歸作者或來源機構所有。
如果您有任何版權方面問題或是本網相關內容侵犯了您的權益,請與我們聯(lián)系,我們核實后將進行整理。


 我要發(fā)布需求,請點我!
COPYRIGT @ 2001-2018 HTTP://m.gzzmzs.cn INC. ALL RIGHTS RESERVED. 管理資源網 版權所有